O desenvolvimento e a avaliação de novas tecnologias de inteligência artificial (IA) são essenciais para o sucesso tecnológico a longo prazo, mas não são tudo. Na Red Hat, também nos dedicamos a criar padrões reutilizáveis e refinar as formas de consumo dos modelos de IA. Fazemos isso para possibilitar a adoção confiante da IA para nós e nossos clientes.
Também nos certificamos de não desconsiderar o lado prático da IA. Por exemplo, como podemos fornecer a todos acesso privado a modelos de IA e minimizar custos ao mesmo tempo? Como podemos aproveitar o valor e a escala do próximo grande sucesso?
Há uma resposta principal: modelos como serviço (MaaS).
Nem todo mundo quer ser expert em IA. E, vamos falar a verdade, nenhuma organização precisa que todos desenvolvam seus próprios modelos. Por enquanto, a meta precisa ser capacitar o máximo de pessoas possível a usar a IA já existente. É aqui que o MaaS entra em cena.
Foi assim que chegamos ao MaaS. Nossos usuários tendem a pertencer a dois grupos:
- Entusiastas da IA: criadores, desenvolvedores, adeptos e profissionais que amam IA
- Todas as outras pessoas: quem só quer usar a IA sem se aprofundar na tecnologia
O MaaS é uma abordagem para fornecer modelos de IA como recursos consumíveis (na forma de endpoints de API) para a sua organização. É a sua equipe de TI, ou nossos engenheiros de plataforma de IA, disponibilizando modelos por trás de um gateway de APIs para capacitar desenvolvedores e, consequentemente, todos os usuários a usar a IA nas tarefas diárias.
Pense nisto: o acesso ao hardware dos gigantes da IA não é liberado. Você tem acesso a aplicações ou endpoints de API. Eles fornecem MaaS. A única diferença é que, neste caso, em vez de alugar serviços, você executa seu próprio MaaS para manter o controle dos custos, acesso e velocidade de inovação.
Parece ótimo, não é?
E é mesmo! Estamos executando MaaS internamente na Red Hat há cerca de um ano. Observamos o seguinte:
Mais inovação com custos reduzidos
Sempre que um novo modelo é lançado, centenas de associados da Red Hat querem implantá-lo imediatamente. O MaaS nos ajuda a implantar o modelo uma só vez e preservar nosso orçamento. Já não é mais necessário alocar 10, 20 ou até 50 GPUs quando o mesmo número de pessoas quer testar um novo modelo.
Assim, todo mundo sai ganhando. Nossos desenvolvedores podem testar novos modelos e se concentrar em desenvolver novas ferramentas sem estourar o orçamento.
Inovação acelerada
Conseguimos seguir nosso próprio cronograma na hora de testar novos modelos lançados. Você se lembra de quando a DeepSeek causou disrupção no mercado de IA? A Red Hat já tinha o DeepSeek R1 em execução e disponível para todos logo após o release. Assim como Granite, Llama 4, Phi etc. (acho que você entendeu).
Privacidade e segurança
Dados confidenciais exigem controle total e cuidadoso. Com o MaaS, você se torna seu próprio provedor de IA privada, com a capacidade de proteger de perto seus ativos digitais. Não é obrigatório usar endpoints de APIs voltados ao público. Na verdade, muitos dos nossos clientes executam os próprios modelos em data centers completamente isolados.
Uso empresarial
O gateway de APIs por trás do MaaS oferece a escalabilidade para alcançar todos os associados, a flexibilidade para acompanhar a inovação e as ferramentas aprimoradas de observabilidade e segurança para implantar modelos de IA do seu jeito.
Custos reduzidos, mais uma vez
O MaaS reduz custos usando diretamente um modelo de recursos compartilhados. É preciso usar menos GPUs para alcançar o mesmo resultado, e as métricas de utilização de GPU vão melhorar. À medida que os modelos melhoram e ficam menores, você aproveitará ainda mais essa infraestrutura. Você pode até usar ferramentas open source de compactação de Large Language Model (LLM) para equilibrar o desempenho e o tamanho do modelo conforme seus próprios requisitos. Em resumo, o MaaS ajuda a otimizar sua infraestrutura e seus modelos para maximizar o ganho.
O MaaS cria a base certa para você se preparar para o futuro. Vamos usar agentes de IA como exemplo. Agentes não são aplicações de uso único nem funcionam com perguntas e respostas. Se você permitir, eles sempre continuam a procurar a resposta. O que isso significa? Tokens. Muitos tokens. Se você quiser escalabilidade e a capacidade de projetar seus custos com maior precisão, considere executar MaaS internamente.
A IA chegou para ficar, e está na hora de encarar custos, velocidade de inovação e privacidade com um olhar mais prático. Modelos como serviço é uma solução promissora, e a Red Hat está comprometida com ela. Se você também prioriza esses fatores, considere usar o MaaS.
Confira esta demonstração interativa onde a Parasol, uma empresa fictícia de seguros, usa MaaS em três aplicações de IA. Para entusiastas em IA, aqui está o repositório do MaaS no GitHub. Por fim, se você participar do Red Hat Summit deste ano, não deixe de se inscrever nas sessões How to become the hero of your artificial intelligence story e LLM-as-a-Service for enterprise: Building a customer large language model platform para aprender mais.
resource
Introdução à IA empresarial: um guia para iniciantes
Sobre o autor
Karl Eklund is a Principal Architect aligning customer goals to solutions provided by the open source community and commercial vendors within the Red Hat OpenShift Data Science platform. Prior to joining Red Hat, Karl advised technology leaders on enterprise data and technology strategies and built machine learning models across multiple academic disciplines.
Mais como este
Navegue por canal
Automação
Últimas novidades em automação de TI para empresas de tecnologia, equipes e ambientes
Inteligência artificial
Descubra as atualizações nas plataformas que proporcionam aos clientes executar suas cargas de trabalho de IA em qualquer ambiente
Nuvem híbrida aberta
Veja como construímos um futuro mais flexível com a nuvem híbrida
Segurança
Veja as últimas novidades sobre como reduzimos riscos em ambientes e tecnologias
Edge computing
Saiba quais são as atualizações nas plataformas que simplificam as operações na borda
Infraestrutura
Saiba o que há de mais recente na plataforma Linux empresarial líder mundial
Aplicações
Conheça nossas soluções desenvolvidas para ajudar você a superar os desafios mais complexos de aplicações
Virtualização
O futuro da virtualização empresarial para suas cargas de trabalho on-premise ou na nuvem