应对当今的 IT 挑战很重要,在红帽全球峰会和 AnsibleFest 大会上,您已了解我们是如何满足各种技术需求的,从提供面向 AI 的开源基础模型平台到新推出 IT 策略即代码等等。但今日转瞬即逝,明日转眼即至。如何在当下破解那些尚未显现的技术难题?幸运的是,我们拥有一种久经考验的方法来帮助我们规划和创造未来:开源社区和项目。
如今,许多人都将 AI/ML 视为一项未来技术。的确,在许多企业组织中,它仍处于战略、规划和构想的萌芽阶段,并非以部署和生产阶段为主。不过,在开源领域,情况并非如此。我们已经在思考如何解决下一波 AI 技术问题。
关于 AI 未来的内容足以占满整个会议的主题演讲,但本文将聚焦于开源项目正在攻克的三个不同领域:
- 大众化
- 可持续性
- 可信赖性
如果您已解决或至少已着手解决这些问题,那么后续的 AI 战略布局可能会变得简单且更容易实现。
大众化
在 AI 术语的界定上,我们需要直率:对于那些用引号括起或标有星号的“开放”模型,模糊的概念很难令人信服。请勿误解我的意思,此类模型在 AI 领域也很重要,但就其开源属性而言,它们并未实现真正意义上的开放。此类模型虽然开放使用权限(多数附带各种限制或规则),但可能不开放外部贡献渠道,其训练数据集和权重也不开放。
这是我们目前已克服的一项挑战,且将继续与 IBM 研究实验室针对此挑战展开合作。除了 InstructLab 之外,IBM 研究实验室目前还在将开源 Apache 许可证应用于 Granite 语言和代码模型。此举意义重大,并非因为通过开源许可证管理模型具有独特性。其独特性在于,如今任何人都可以通过 InstructLab 优化此类模型。
不仅如此,您还可以将 AI 模型训练为您的专属 AI 模型。想构建一个以钓鱼为主题的聊天机器人?行动起来,回馈他人的贡献,让我们共同构建 ChatGoFish。想构建一个专注于真正特定的小众技术领域的问题排查机器人?可通过 InstructLab 来实现。当您真正将开源原则应用于 AI 模型时,您会发现无限的可能性,我们正是为此而生。
可持续性
我们直击主题,模型训练和 AI 推理的能耗巨大。据国际能源署预计,到 2026 年,AI 行业的电力需求将激增至当前水平的 10 倍。除了加密货币矿场在能源领域面临竞争压力之外,这还意味着什么?
这意味着我们需要利用软件(开源软件)来协助应对这一挑战。AI 的初期采用阶段几乎总是具有高能耗的特点,但我们可以巧妙应对。我们已经通过 Kepler 项目在现代化企业 IT 方面采取了相关措施,该项目有助于深入了解云原生应用和基础架构的碳足迹和能源效率。它目前已在红帽 OpenShift 4.15 中以技术预览版形式提供。
但是,如果我们能够借助开放创新的力量,使 Kepler 变为一个不仅可以监控 CPU 能耗,还可以监控 GPU 能耗的工具,会带来什么变化?
我们正在实现这一目标,即:使用 Kepler 来评估 ML 模型在训练和推理过程中的能耗。您可以全面了解传统 IT 和 AI 的能耗情况,这也是通过开源技术实现的。
可信赖性
与任何令人振奋的新技术一样,我们需要能够高效保护并提高 AI 工作负载、模型和平台的安全性。缺乏安全保障的创新也是一种“风险”,而企业和开源社区都希望将这种风险降至最低。
在软件领域,供应链和溯源是提供更安全体验的关键。这意味着要清楚了解特定代码的来源、编码者和访问者,才能将其投入生产。由红帽主导的 Sigstore 项目有助于证明您在应用开发的所有阶段中使用的开源代码的准确性。
现在,我们需要将同样的远见、原则和严谨性应用于 AI 模型,这也是红帽和开源社区正在做的:创建 AI 物料清单,使用供应链安全防护工具为模型的构建提供更可靠的保证。
与安全防护密不可分的是可信赖性,您和您所在的企业组织如何判断能否信任那些承载未来发展的 AI 模型和工作负载?这正是 TrustyAI 的价值所在。它可以帮助技术团队了解 AI 模型的合理性,并标记潜在的问题行为。
希望您能通过上述示例了解开源如何在将来提高 AI 的可访问性、可持续性、安全性和可信赖性。在红帽,我们很荣幸能够走在推动所有这些技术的最前沿,如果没有开源社区协作来激发新的思维方式,这一切都无法实现。
关于作者
Chris Wright is senior vice president and chief technology officer (CTO) at Red Hat. Wright leads the Office of the CTO, which is responsible for incubating emerging technologies and developing forward-looking perspectives on innovations such as artificial intelligence, cloud computing, distributed storage, software defined networking and network functions virtualization, containers, automation and continuous delivery, and distributed ledger.
During his more than 20 years as a software engineer, Wright has worked in the telecommunications industry on high availability and distributed systems, and in the Linux industry on security, virtualization, and networking. He has been a Linux developer for more than 15 years, most of that time spent working deep in the Linux kernel. He is passionate about open source software serving as the foundation for next generation IT systems.