Assinar feed RSS

O desenvolvimento e a avaliação de novas tecnologias de inteligência artificial (IA) são essenciais para o sucesso tecnológico a longo prazo, mas não são tudo. Na Red Hat, também nos dedicamos a criar padrões reutilizáveis e refinar as formas de consumo dos modelos de IA. Fazemos isso para possibilitar a adoção confiante da IA para nós e nossos clientes. 

Também nos certificamos de não desconsiderar o lado prático da IA. Por exemplo, como podemos fornecer a todos acesso privado a modelos de IA e minimizar custos ao mesmo tempo? Como podemos aproveitar o valor e a escala do próximo grande sucesso?

Há uma resposta principal: modelos como serviço (MaaS).  

Nem todo mundo quer ser expert em IA. E, vamos falar a verdade, nenhuma organização precisa que todos desenvolvam seus próprios modelos. Por enquanto, a meta precisa ser capacitar o máximo de pessoas possível a usar a IA já existente. É aqui que o MaaS entra em cena.

Conheça a abordagem de modelo como serviço

Foi assim que chegamos ao MaaS. Nossos usuários tendem a pertencer a dois grupos:

  1. Entusiastas da IA: criadores, desenvolvedores, adeptos e profissionais que amam IA
  2. Todas as outras pessoas: quem só quer usar a IA sem se aprofundar na tecnologia

O MaaS é uma abordagem para fornecer modelos de IA como recursos consumíveis (na forma de endpoints de API) para a sua organização. É a sua equipe de TI, ou nossos engenheiros de plataforma de IA, disponibilizando modelos por trás de um gateway de APIs para capacitar desenvolvedores e, consequentemente, todos os usuários a usar a IA nas tarefas diárias. 

Pense nisto: o acesso ao hardware dos gigantes da IA não é liberado. Você tem acesso a aplicações ou endpoints de API. Eles fornecem MaaS. A única diferença é que, neste caso, em vez de alugar serviços, você executa seu próprio MaaS para manter o controle dos custos, acesso e velocidade de inovação. 

Parece ótimo, não é? 

E é mesmo! Estamos executando MaaS internamente na Red Hat há cerca de um ano. Observamos o seguinte: 

Mais inovação com custos reduzidos

Sempre que um novo modelo é lançado, centenas de associados da Red Hat querem implantá-lo imediatamente. O MaaS nos ajuda a implantar o modelo uma só vez e preservar nosso orçamento. Já não é mais necessário alocar 10, 20 ou até 50 GPUs quando o mesmo número de pessoas quer testar um novo modelo.

Assim, todo mundo sai ganhando. Nossos desenvolvedores podem testar novos modelos e se concentrar em desenvolver novas ferramentas sem estourar o orçamento. 

Inovação acelerada

Conseguimos seguir nosso próprio cronograma na hora de testar novos modelos lançados. Você se lembra de quando a DeepSeek causou disrupção no mercado de IA? A Red Hat já tinha o DeepSeek R1 em execução e disponível para todos logo após o release. Assim como Granite, Llama 4, Phi etc. (acho que você entendeu).

Privacidade e segurança

Dados confidenciais exigem controle total e cuidadoso. Com o MaaS, você se torna seu próprio provedor de IA privada, com a capacidade de proteger de perto seus ativos digitais. Não é obrigatório usar endpoints de APIs voltados ao público. Na verdade, muitos dos nossos clientes executam os próprios modelos em data centers completamente isolados.

Uso empresarial

O gateway de APIs por trás do MaaS oferece a escalabilidade para alcançar todos os associados, a flexibilidade para acompanhar a inovação e as ferramentas aprimoradas de observabilidade e segurança para implantar modelos de IA do seu jeito.

Custos reduzidos, mais uma vez

O MaaS reduz custos usando diretamente um modelo de recursos compartilhados. É preciso usar menos GPUs para alcançar o mesmo resultado, e as métricas de utilização de GPU vão melhorar. À medida que os modelos melhoram e ficam menores, você aproveitará ainda mais essa infraestrutura. Você pode até usar ferramentas open source de compactação de Large Language Model (LLM) para equilibrar o desempenho e o tamanho do modelo conforme seus próprios requisitos. Em resumo, o MaaS ajuda a otimizar sua infraestrutura e seus modelos para maximizar o ganho.

O MaaS cria a base certa para você se preparar para o futuro. Vamos usar agentes de IA como exemplo. Agentes não são aplicações de uso único nem funcionam com perguntas e respostas. Se você permitir, eles sempre continuam a procurar a resposta. O que isso significa? Tokens. Muitos tokens. Se você quiser escalabilidade e a capacidade de projetar seus custos com maior precisão, considere executar MaaS internamente. 

A IA chegou para ficar, e está na hora de encarar custos, velocidade de inovação e privacidade com um olhar mais prático. Modelos como serviço é uma solução promissora, e a Red Hat está comprometida com ela. Se você também prioriza esses fatores, considere usar o MaaS.

Confira esta demonstração interativa onde a Parasol, uma empresa fictícia de seguros, usa MaaS em três aplicações de IA. Para entusiastas em IA, aqui está o repositório do MaaS no GitHub. Por fim, se você participar do Red Hat Summit deste ano, não deixe de se inscrever nas sessões How to become the hero of your artificial intelligence storyLLM-as-a-Service for enterprise: Building a customer large language model platform para aprender mais.

resource

Introdução à IA empresarial: um guia para iniciantes

Leia este guia para principiantes e descubra como o Red Hat OpenShift AI e o Red Hat Enterprise Linux AI podem ajudar a acelerar sua jornada de adoção da inteligência artificial.

Sobre o autor

Karl Eklund is a Principal Architect aligning customer goals to solutions provided by the open source community and commercial vendors within the Red Hat OpenShift Data Science platform. Prior to joining Red Hat, Karl advised technology leaders on enterprise data and technology strategies and built machine learning models across multiple academic disciplines.

Read full bio
UI_Icon-Red_Hat-Close-A-Black-RGB

Navegue por canal

automation icon

Automação

Últimas novidades em automação de TI para empresas de tecnologia, equipes e ambientes

AI icon

Inteligência artificial

Descubra as atualizações nas plataformas que proporcionam aos clientes executar suas cargas de trabalho de IA em qualquer ambiente

open hybrid cloud icon

Nuvem híbrida aberta

Veja como construímos um futuro mais flexível com a nuvem híbrida

security icon

Segurança

Veja as últimas novidades sobre como reduzimos riscos em ambientes e tecnologias

edge icon

Edge computing

Saiba quais são as atualizações nas plataformas que simplificam as operações na borda

Infrastructure icon

Infraestrutura

Saiba o que há de mais recente na plataforma Linux empresarial líder mundial

application development icon

Aplicações

Conheça nossas soluções desenvolvidas para ajudar você a superar os desafios mais complexos de aplicações

Virtualization icon

Virtualização

O futuro da virtualização empresarial para suas cargas de trabalho on-premise ou na nuvem