NVIDIA 与 Ineffable Intelligence 共同推进构建强化学习基础设施的未来
强化学习智能体 —— 即通过不断试错来学习的 AI 系统,能够将算力转化为全新的知识。 这正是 NVIDIA 与 Ineffable Intelligence 之间全新工程级合作的核心内容。Ineffable Intelligence 是一家总部位于伦敦的 AI 实验室,由 AlphaGo 架构师 David Silver 创立,该公司在上周刚结束隐身模式,正式对外亮相。 NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 的下一个前沿发展是超级学习者 —— 即能够从经验中持续学习的系统。我们很
强化学习智能体 —— 即通过不断试错来学习的 AI 系统,能够将算力转化为全新的知识。
这正是 NVIDIA 与 Ineffable Intelligence 之间全新工程级合作的核心内容。Ineffable Intelligence 是一家总部位于伦敦的 AI 实验室,由 AlphaGo 架构师 David Silver 创立,该公司在上周刚结束隐身模式,正式对外亮相。
NVIDIA 创始人兼首席执行官黄仁勋表示:“AI 的下一个前沿发展是超级学习者 —— 即能够从经验中持续学习的系统。我们很高兴能与 Ineffable Intelligence 合作,共同设计用于大规模强化学习的基础设施,助力其推动 AI 的前沿发展,并开创新一代智能系统。”
Silver 是强化学习领域的先驱之一,这种方法已经改变了 AI 研究。他致力于将这种方法进一步发展为一种全新的范式。
Silver 表示:“在 AI 领域研究人员已经基本解决了相对简单的问题:即如何构建能够掌握人类已有知识的系统。但现在,我们需要解决更难的 AI 问题:如何构建能够自主发现新知识的系统。这需要一种截然不同的方法 —— 即从经验中学习的系统。”
这种学习需要一条强大且高度优化的管线来支撑。与预训练不同,预训练是把固定的人类数据输入系统,而强化学习工作负载会实时生成数据。
该系统必须在紧密循环中持续执行操作、观察、评分和更新,这给互连技术、显存带宽和服务带来了预训练所没有的压力。此外,该系统将基于与人类语言和其他人类数据截然不同的丰富经验进行训练,可能需要全新的模型架构和训练算法。
这正是 NVIDIA 和 Ineffable 技术协作的重点所在:构建一个能够大规模为强化学习系统提供数据的管线。两家公司的工程师团队正通力合作,探索创建此训练管线的理想方式。
这项工作正基于 NVIDIA Grace Blackwell 平台上展开,并将成为首批探索即将推出的 NVIDIA Vera Rubin 平台的项目之一。随着 AI 世界转向通过仿真和经验而非人类数据进行学习的模型,此举旨在了解未来所需的下一代硬件和软件。
妥善构建这一基础设施将在高度复杂和丰富环境中解锁前所未有的大规模强化学习,使智能体能够在各个知识领域中取得突破性发现。