A Red Hat, líder mundial no fornecimento de soluções open source, continua oferecendo liberdade de escolha em IA empresarial com o lançamento do Red Hat AI Inference Server, modelos validados por terceiros no Red Hat AI, e a integração com as APIs Llama Stack e Model Context Protocol (MCP), além de atualizações significativas em todo o portfólio Red Hat AI. Com esses avanços, a Red Hat busca ampliar ainda mais as capacidades necessárias para acelerar a adoção de IA, oferecendo mais liberdade e confiança aos clientes em implementações de IA generativa (gen AI) em ambientes de nuvem híbrida.
Inferência mais rápida e eficiente está se tornando o novo ponto decisivo para inovação em gen AI.
De acordo com a Forrester, o software open source será o motor para acelerar os esforços de IA empresarial¹. À medida que o cenário de IA se torna mais complexo e dinâmico, o Red Hat AI Inference Server e os modelos validados por terceiros oferecem inferência eficiente e uma coleção testada de modelos de IA otimizados para desempenho na plataforma Red Hat AI. Com a integração de novas APIs para desenvolvimento de agentes de gen AI, incluindo Llama Stack e MCP, a Red Hat trabalha para simplificar a complexidade de implantação, capacitando líderes de TI, cientistas de dados e desenvolvedores a avançar suas iniciativas de IA com mais controle e eficiência.
Inferência eficiente na nuvem híbrida com Red Hat AI Inference Server
O portfólio Red Hat AI agora inclui o novo Red Hat AI Inference Server, oferecendo uma inferência mais rápida, consistente e econômica em escala, em ambientes de nuvem híbrida. Essa adição está integrada às versões mais recentes do Red Hat OpenShift AI e do Red Hat Enterprise Linux AI, e também está disponível como uma solução independente, permitindo que organizações implantem aplicações inteligentes com mais eficiência, flexibilidade e desempenho.
Modelos testados e otimizados com Red Hat AI e validação de terceiros
Os modelos validados por terceiros do Red Hat AI, disponíveis no Hugging Face, facilitam a escolha das empresas no momento de encontrar os modelos certos para suas necessidades. O Red Hat AI oferece uma coleção de modelos validados, além de orientações de implantação que aumentam a confiança dos clientes no desempenho dos modelos e na reprodutibilidade dos resultados. Modelos selecionados também são otimizados pela Red Hat, com técnicas de compressão de modelo que reduzem seu tamanho e aumentam a velocidade de inferência, ajudando a minimizar o consumo de recursos e os custos operacionais. Além disso, o processo contínuo de validação de modelos ajuda os clientes Red Hat AI a se manterem na vanguarda da inovação em gen AI.
APIs padronizadas para desenvolvimento de aplicações e agentes de IA com Llama Stack e MCP
O Red Hat AI está integrando o Llama Stack, inicialmente desenvolvido pela Meta, juntamente com o MCP da Anthropic, para fornecer APIs padronizadas para construção e implantação de aplicações e agentes de IA. Atualmente disponível em versão de prévia para desenvolvedores no Red Hat AI, o Llama Stack oferece uma API unificada para acesso a inferência com vLLM, geração aumentada por recuperação (RAG), avaliação de modelos, guardrails e agentes, em qualquer modelo de gen AI. O MCP permite que os modelos se integrem a ferramentas externas, fornecendo uma interface padronizada para conexão com APIs, plugins e fontes de dados em fluxos de trabalho de agentes.
A última versão do Red Hat OpenShift AI (v2.20) oferece melhorias adicionais para construir, treinar, implantar e monitorar modelos de IA generativa e preditiva em escala. Os destaques incluem:
- Catálogo de modelos otimizado (prévia técnica): acesso facilitado a modelos validados da Red Hat e de terceiros, com implantação via console web e gerenciamento completo do ciclo de vida com registro integrado do OpenShift.
- Treinamento distribuído com KubeFlow Training Operator: execução de ajustes de modelo com InstructLab e cargas de trabalho PyTorch distribuídas em vários nós e GPUs do Red Hat OpenShift, com rede RDMA distribuída para aceleração e melhor uso de GPU, a fim de reduzir custos.
- Feature store (prévia técnica): baseado no projeto upstream Kubeflow Feast, oferece um repositório centralizado para gerenciamento e fornecimento de dados para treinamento e inferência, otimizando o fluxo de dados e melhorando a precisão e reusabilidade dos modelos.
O Red Hat Enterprise Linux AI 1.5 traz novas atualizações para a plataforma de modelos de base da Red Hat, voltada ao desenvolvimento, teste e execução de modelos de linguagem de grande escala (LLMs) . Os principais recursos da versão 1.5 do RHEL AI incluem:
- Disponibilidade no Google Cloud Marketplace, ampliando a escolha dos clientes para rodar o Red Hat Enterprise Linux AI em nuvens públicas (além de AWS e Azure), facilitando a implantação e o gerenciamento de cargas de trabalho de IA no Google Cloud.
- Capacidades aprimoradas em múltiplas línguas para espanhol, alemão, francês e italiano via InstructLab, permitindo personalização de modelos com scripts nativos e ampliando as possibilidades de aplicações de IA multilíngue. Os usuários também podem usar seus próprios modelos "teacher" e "student" para maior controle em personalização e testes, com suporte futuro previsto para japonês, hindi e coreano.
O Red Hat AI InstructLab on IBM Cloud agora tem disponibilidade geral. Esse novo serviço em nuvem simplifica ainda mais o processo de personalização de modelos, melhorando a escalabilidade e a experiência do usuário. As empresas podem usar seus dados de forma mais eficiente e com maior controle.
Visão da Red Hat: qualquer modelo, qualquer acelerador, qualquer nuvem
O futuro da IA deve ser definido por oportunidades ilimitadas e não restrito por silos de infraestrutura. A Red Hat enxerga um horizonte no qual as organizações possam implantar qualquer modelo, em qualquer acelerador, em qualquer nuvem, entregando uma experiência de usuário excepcional e mais consistente, sem custos exorbitantes. Para desbloquear o verdadeiro potencial dos investimentos em gen AI, as empresas precisam de uma plataforma universal de inferência — um novo padrão para inovações em IA contínuas e de alto desempenho, tanto no presente quanto nos próximos anos.
Red Hat Summit
Participe das keynotes do Red Hat Summit para ouvir as últimas novidades de executivos, clientes e parceiros da Red Hat:
- Infraestrutura moderna alinhada à IA empresarial —Terça-feira, 20 de maio, 8h -10h EDT (YouTube)
- A nuvem híbrida evolui para impulsionar a inovação empresarial — Quarta-feira, 21 de maio, 8h-9h30 EDT (YouTube)
Citações de apoio
Joe Fernandes, vice-presidente e general manager, Unidade de Negócios de IA, Red Hat
"Inferência mais rápida e eficiente está se tornando o novo ponto decisivo para inovação em gen AI. Com o Red Hat AI Inference Server e uma nova coleção de modelos validados por terceiros, o Red Hat AI ajuda as organizações a implantar aplicações inteligentes onde for necessário, como for necessário e com os componentes que melhor atenderem às suas necessidades específicas."
Michele Rosen, gerente de pesquisa, IDC
“As organizações estão indo além dos primeiros contatos com a IA e focando em implantações práticas. O segredo para o sucesso contínuo está na capacidade de adaptação das estratégias de IA para diferentes ambientes e necessidades. O futuro da IA exige não apenas modelos poderosos, mas modelos que possam ser implantados com capacidade de proporcionar um custo-benefício à altura. Para empresas que buscam escalar suas iniciativas de IA, essa flexibilidade será absolutamente essencial."
1Fonte: Navigate The Open-Source AI Ecosystem In The Cloud, Forrester Research, Inc., Fevereiro de 2025
Additional Resources
- Descubra mais sobre o Red Hat AI
- Descubra mais sobre o Red Hat AI Inference Server
- Descubra mais sobre o Red Hat OpenShift AI
- Descubra mais sobre o Red Hat Enterprise Linux AI
- Descubra mais sobre os Red Hat AI validated models
- Ouça mais sobre o Red Hat AI Inference Server dos executivos da Red Hat
- Leia sobre o projeto de comunidade llm-d
- Saiba mais sobre o trabalho da Red Hat com a Meta
- Saiba mais sobre o trabalho da Red Hat com a NVIDIA
- Saiba mais sobre o trabalho da Red Hat com o Google
- Saiba mais sobre o trabalho da Red Hat com a AMD
- Leia mais sobre Llama Stack and MCP
- Leia mais sobre validação de modelos
- Leia mais sobre LLM model compression
- Leia mais sobre feature store
- Descubra mais sobre a IA na edge
- Descubra mais sobre Red Hat Summit
- Veja todos os anúncios da Red Hat na sala de imprensa do Red Hat Summit
- Siga @RedHatSummit ou #RHSummit no X para receber atualizações do evento
Connect with Red Hat
- Descubra mais sobre a Red Hat
- Receba notícias na sala de notícias da Red Hat
- Leia o Red Hat blog
- Siga a Red Hat no X
- Siga a Red Hat no Instagram
- Siga a Red Hat no LinkedIn
- Veja vídeos da Red Hat no YouTube
- SOBRE A RED HAT
A Red Hat é líder em tecnologia de nuvem híbrida aberta, e proporciona uma base confiável, consistente e abrangente para uma inovação transformadora em TI e aplicações de inteligência artificial (IA). Seu portfólio de tecnologias de nuvem, desenvolvimento, IA, Linux e automação permite a implementação de qualquer aplicação, em qualquer lugar, desde data centers até a edge. Como líder mundial no fornecimento de soluções de software open source empresarial, a Red Hat investe em ecossistemas e comunidades abertas para resolver os desafios de TI do futuro. Por meio da colaboração, a Red Hat ajuda clientes e parceiros a construir, conectar, automatizar, proteger e gerenciar seus ambientes de TI, com o suporte de serviços de consultoria, treinamento e certificação reconhecidos mundialmente.
- DECLARAÇÕES PROSPECTIVAS
Exceto pelas informações históricas e discussões contidas aqui, as declarações contidas neste comunicado de imprensa podem constituir declarações prospectivas dentro do significado da Lei de Reforma da Litígios de Valores Mobiliários de 1995. As declarações prospectivas são baseadas nas suposições atuais da empresa sobre o desempenho futuro dos negócios e financeiros. Essas declarações envolvem uma série de riscos, incertezas e outros fatores que podem fazer com que os resultados reais sejam materialmente divergentes. Qualquer declaração prospectiva neste comunicado fala apenas na data em que foi feita. Exceto quando exigido por lei, a empresa não assume a obrigação de atualizar ou revisar qualquer declaração prospectiva.
###
Red Hat, Red Hat Enterprise Linux, o logo da Red Hat e OpenShift são marcas comerciais ou marcas registradas da Red Hat, Inc. ou suas subsidiárias nos EUA e outros países. Linux® é a marca registrada de Linus Torvalds nos EUA e outros países.