OpenAI 算力负责人萨钦・卡蒂OpenAI 算力负责人萨钦・卡蒂

  OpenAI 算力负责人萨钦・卡蒂在交流中透露,公司考虑对外开源自研适配多品牌芯片的调度软件,此举或将撼动英伟达赖以立足的核心软件优势。
  本次访谈由专栏作者、Amp 创始人安杰尼・米达、半导体分析机构 SemiAnalysis 数据中心行业专家杰雷米・埃利亚乌・翁蒂韦罗斯共同参与。
  访谈围绕 AI 企业跨多品牌服务器芯片、跨多家云厂商部署算力业务展开。OpenAI、安索帕(Anthropic)、Meta 均不愿在核心算力环节单一依赖某一家供应商,且单一厂商也无法满足其海量算力采购需求。
  卡蒂表示:“未来算力市场必然走向多芯片异构混用格局。”
  过往数年 OpenAI 算力几乎全盘依托英伟达芯片,近期已陆续敲定合作,接入亚马逊、赛雷布拉斯(Cerebras)、AMD 自研 AI 芯片,同时自主研发定制化芯片。被问及是否效仿 Anthropic、Meta 采用谷歌自研芯片时,卡蒂未予以答复。
  跨不同硬件架构开发、运行大型 AI 模型门槛很高,需要工程师吃透各类底层硬件细节。
  卡蒂介绍,OpenAI 正在研发一款抽象层软件,研发与产品团队借助该工具部署业务时,无需关注底层服务器硬件型号。谷歌早年正是依靠同类硬件抽象调度软件(标杆产品为 Borg 算力管理系统)实现业务规模化落地。“当下我们正沿着相同路径落地 AI 算力架构。”
  米达指出:倘若 OpenAI 对外开源这套跨英伟达、谷歌、AMD 等全品类芯片的 AI 调度软件,将对现有行业格局形成颠覆性冲击。
  被问及开源可行性,卡蒂明确该方案已纳入备选:
  “我们希望把这套智能调度优化能力面向全行业开放,也就是智能体优化技术。” 他并未详述具体落地方式与时间表。
  上述表态备受市场关注:英伟达长期依靠CUDA 闭源软件生态(编译器、程序库、硬件优化工具套件)构筑行业护城河,是其垄断 AI 芯片市场的关键。卡蒂认为,依托 AI 自动生成多硬件适配优化代码,未来会逐步瓦解 CUDA 的独占优势。
  “我们正利用 AI 生成硬件优化内核代码,实现全品类芯片兼容落地。”
  现阶段多款开源软件已在分流 CUDA 生态:Meta 开源的 PyTorch 框架大幅降低跨芯片代码开发难度,不少初创企业还推出代码编译工具,可将 PyTorch 高层代码转译为适配各类芯片的底层指令。
  英伟达 Vera Rubin 新一代芯片相关进展
  座谈同步披露 OpenAI 对接英伟达新一代 Vera Rubin 芯片集群的筹备进度。
  卡蒂透露,OpenAI 已拿到该芯片工程样片,计划在今年年底上线用于大模型训练。英伟达从上代 Blackwell 芯片落地故障中吸取经验:初代 Blackwell 因组网、固件、布线设计繁杂,各大云厂商规模化部署屡屡受阻,后续迭代版本故障问题显著改善。
  “英伟达妥善解决了量产落地中的各类磨合难题,值得肯定。”
  卡蒂未透露首批 Vera Rubin 算力集群落地的合作云厂商,仅表示微软甲骨文、亚马逊等主力服务商正积极竞标首波落地名额,行业竞争激烈。
  他还提到,当前扩充算力的最大瓶颈不在于芯片产能,而是配套供电基建与新硬件上线的工程落地难度。
  “现阶段电力配套、工程实施能力才是制约算力扩容的核心因素。”

责任编辑:郭明煜

mk足球官网,头玩官方下载,

mk体育在线相关资讯:头玩pc版,