全球领先的开源解决方案提供商红帽公司近日宣布推出红帽AI推理
红帽AI推理服务器旨
在满足大规模高性能、快速响应的推理需求,同时保持低资源需求, 提供一个通用推理层,支持任意模型在任意环境中的任意加速器上运 行。
推理是AI的关键执行引擎,
红帽推出红帽AI推理服务器解决这些挑战。红帽AI推理服务器是
vLLM:拓展推理创新
红帽AI推理服务器基于加州大学伯克利分校于2023年中启动的
vLLM广泛支持公开可用的模型,并具备与先进前沿模型(包括D
推出红帽AI推理服务器
红帽AI推理服务器将vLLM的前沿创新整合进自身的企业级能力
无论在何种部署环境中,红帽AI推理服务器均向用户提供经过加固
- 智能LLM压缩工具,可大幅缩减基础AI模型与微调AI模型大小
,在保持甚至可能进一步提升模型准确性的同时, 最小化计算资源消耗。 - 优化的模型存储库,托管在红帽AI组织的Hugging Face中,提供对经过验证和优化的前沿AI模型集合的即时访问
,这些模型已准备好用于推理部署,可助力效率提升2-4倍, 同时不影响模型准确性。 - 红帽的企业支持,
以及在将社区项目带入生产环境方面数十年的专业经验。 - 第三方支持,实现更大的部署灵活性,支持红帽AI推理服务器在非
红帽Linux和Kubernetes平台上部署,具体遵循红帽 第三方支持政策 。
红帽的愿景:任意模型,任意加速器,任意云,自由部署
AI的未来应当充满无限机遇,而不应受到基础设施孤岛的限制。
正如红帽通过将Linux转变为现代IT的基石,开创了开源企业
支持证言
红帽AI业务部门副总裁兼总经理Joe Fernandes
“推理是生成式AI的真正价值所在,即在用户进行交互时,
AMD AI产品管理企业副总裁Ramine Roane
“通过与红帽合作,AMD提供开箱即用的解决方案,
思科高级副总裁兼总经理Jeremy Foster
“AI工作负载需要速度、一致性和灵活性,而这正是红帽AI推理
英特尔数据中心与AI软件解决方案及生态系统副总裁Bill Pearson
“英特尔很高兴与红帽合作,在英特尔® Gaudi® 加速器上启用红帽AI推理服务器。
NVIDIA企业软件副总裁John Fanelli
“高性能推理使模型和AI智能体不仅能够回答问题,
Additional Resources
- 进一步了解红帽AI
- 进一步了解红帽OpenShift AI
- 进一步了解红帽企业Linux AI
- 了解更多红帽全球峰会相关信息
- 查看红帽全球峰会新闻中心
新闻摘要
红帽 AI推理服务器旨在简化并加速生成式AI在混合云环境中的部署。
Mentioned in this article
红帽AI, vLLM, Neural Magic, 红帽AI推理服务器, 红帽OpenShift AI, RHEL AI
了解更多信息
- 进一步了解红帽AI
- 进一步了解红帽OpenShift AI
- 进一步了解红帽企业Linux AI
- 关于红帽
红帽是开放混合云技术的领导者,为变革性的IT创新和AI应用提供可信、一致且全面的基础。红帽的云、开发者、AI、Linux、自动化和应用平台等技术产品组合,协助企业从数据中心到边缘跨环境部署任意应用。作为全球领先的企业级开源软件解决方案提供商,红帽积极投入开放生态系统和社区,解决未来的IT挑战。通过与合作伙伴和客户紧密协作,帮助他们构建、连接、自动化、保护和管理IT环境,并提供咨询服务以及屡获殊荣的培训和认证方案。
- 前瞻性声明
除本新闻稿中所载的历史信息与讨论外,其他陈述可能构成1995年《美国私人证券诉讼改革法案》项下的前瞻性声明。此类声明基于公司对未来业务和财务表现的当前预期与假设,涉及多项风险、不确定性及其他可能导致实际结果与预期大相径庭的因素。本新闻稿中的任何前瞻性声明仅反映其发布当日的情况。除非法律另有规定,公司不承担更新或修订任何前瞻性声明的义务。
###
红帽、Red Hat Enterprise Linux、红帽标识及OpenShift均为Red Hat, Inc.或其子公司在美国及其他国家/地区的商标或注册商标。Linux®是Linus Torvalds在美国及其他国家/地区的注册商标。