订阅 RSS 源

开发和评估新的人工智能(AI)技术对于在技术方面实现长期成功至关重要,但这并非全部。在红帽,我们还致力于创建可重复使用的模式,并优化 AI 模型的应用方式。这一切的努力,都是为了让红帽和客户都能更自信地采用 AI 技术。 

我们同样关注 AI 实践落地过程中的现实挑战。例如,如何在尽可能降低成本的同时,为每个人提供对 AI 模型的私有访问权限?如何利用“下一代颠覆性技术”的价值与规模效应?

关键答案便是:模型即服务(MaaS)。  

并非人人都想成为 AI 专家,坦白说,也没有哪个企业组织需要全员构建自己的模型。现阶段的目标,应该是让尽可能多的人能够利用现有的 AI 技术,而这正是模型即服务的价值所在。

模型即服务详解

我们最终选择模型即服务解决方案的考量过程如下。我们的用户通常分为两类:

  1. AI 爱好者——那些对 AI 感兴趣的 AI 构建者、开发人员、业余爱好者和专业人士
  2. 其他用户——那些只想使用 AI 而不愿深究技术细节的人

模型即服务是一种将 AI 模型作为可消费资源,以 API 端点形式提供给企业组织的方法。它由您的 IT 团队或 AI 平台工程师负责,将模型部署在 API 网关后方,从而赋能开发人员,进而让所有用户都能在日常任务中使用 AI 技术。 

不妨这样想:AI 巨头不会向您提供硬件访问权限,而是提供其应用或 API 端点的访问权限。他们本质上提供的就是模型即服务。唯一不同的是,在此情境下,您无需租用他们的服务,而是可以运行自己的模型即服务解决方案,以掌控成本、访问权限及创新速度。 

听起来很棒,对吧? 

确实如此!我们在红帽内部运行模型即服务已近一年。以下是我们的观察发现:

以更低成本获得更多创新成果

每当有新模型发布,数百名红帽员工都希望立即部署它。借助模型即服务,我们能够一次性部署模型并节省预算!过去每当 10 人、20 人乃至 50 多人想要试用新模型,便需相应配置数十张 GPU 的时代一去不复返。

这是一种双赢的局面。我们的开发人员既能尝试新模型,专注于构建新工具,又无需花费大量资金。 

加速创新

我们能够按照自己的节奏测试任何新上市的模型。还记得 DeepSeek 如何颠覆 AI 市场吗?DeepSeek R1 发布后不久,我们便将该模型投入运行并面向所有人开放。Granite、Llama 4、Phi 等模型也是如此,您懂的。

隐私和安全性

敏感数据需要全面且审慎的管控。借助模型即服务,您可成为自己的私有 AI 提供商,严密守护数字资产。您无需使用面向公众的 API 端点。事实上,许多客户选择在完全物理隔离的数据中心中运行自己的模型。

企业级应用

为模型即服务提供支持的 API 网关可为您提供:所需的可扩展性,以覆盖每位员工;所需的灵活性,以跟上创新步伐;以及增强的安全性和可观测性工具,使您能够按照自己的节奏高效部署 AI 模型。

进一步降低成本

模型即服务通过直接采用共享资源模型来降低成本。您会发现,实现相同效果所需的 GPU 数量减少,且 GPU 利用率指标也将提升。随着模型持续优化和精简,资源占用量也会减少,而您能够从中受益。您甚至可以使用开源大型语言模型(LLM)压缩工具,在模型性能与规模之间取得平衡,以满足自身需求。简而言之,模型即服务可帮助您优化资源占用和模型配置,以实现效益最大化。

模型即服务旨在奠定可靠的基础,同时面向未来做好准备。以 AI 代理为例。代理并非一次性问答应用。只要获得授权,它们将持续搜寻答案。这意味着什么呢?消耗词元,并且是海量的词元。如果您希望实现可扩展性并更准确地预测成本,建议考虑在内部运行模型即服务。 

AI 已成必然趋势,现在是时候务实考量成本、创新速度和隐私保护了。模型即服务是一种极具潜力的解决方案,也是红帽公司致力于推进的方向。如果这些也是您的优先事项,那么模型即服务值得认真考虑。

来看看这个互动演示案例:虚构的保险公司 Parasol 利用模型即服务解决方案,为三款 AI 应用提供支持!对于 AI 爱好者来说,我们提供了模型即服务 Github 存储库。最后,如果您今年参加红帽全球峰会,请务必注册报名参加“How to become the hero of your artificial intelligence story”(如何成为企业人工智能转型的赋能者)和“LLM-as-a-Service for enterprise: Building a customer large language model platform”(面向企业的大语言模型即服务:构建客户大语言模型平台)课程,以了解更多信息。

resource

开启企业 AI 之旅:新手指南

此新手指南介绍了红帽 OpenShift AI 和红帽企业 Linux AI 如何加快您的 AI 采用之旅。

关于作者

Karl Eklund is a Principal Architect aligning customer goals to solutions provided by the open source community and commercial vendors within the Red Hat OpenShift Data Science platform. Prior to joining Red Hat, Karl advised technology leaders on enterprise data and technology strategies and built machine learning models across multiple academic disciplines.

Read full bio
UI_Icon-Red_Hat-Close-A-Black-RGB

按频道浏览

automation icon

自动化

有关技术、团队和环境 IT 自动化的最新信息

AI icon

人工智能

平台更新使客户可以在任何地方运行人工智能工作负载

open hybrid cloud icon

开放混合云

了解我们如何利用混合云构建更灵活的未来

security icon

安全防护

有关我们如何跨环境和技术减少风险的最新信息

edge icon

边缘计算

简化边缘运维的平台更新

Infrastructure icon

基础架构

全球领先企业 Linux 平台的最新动态

application development icon

应用领域

我们针对最严峻的应用挑战的解决方案

Virtualization icon

虚拟化

适用于您的本地或跨云工作负载的企业虚拟化的未来