马斯克诉奥特曼案的法庭上,OpenAI联合创始人、总裁布洛克曼(Greg Brockman)作证,回忆2017年与马斯克在OpenAI内部控制权之争时,说了一句炸裂的话:“他懂火箭,懂电动车,但他当时不懂、而且我相信现在也不懂AI。”所以,他选择了支持奥特曼。
什么?世界上最具影响力的科技人物,十多年来向AI领域投入了数百亿美元,他竟然不懂自己在做的事?

其实,即使要搞清楚马斯克是不是“懂”AI,还真需要从头谈起。
2012年,马斯克以个人身份参与投资DeepMind这家名不见经传的伦敦研究机构。他是AI学术小圈子之外最早感知到深度学习潜力的人士之一。2015年,他与奥特曼(Sam Altman)、布洛克曼等人联合创办OpenAI,试图以非营利方式对冲AI风险。2016年,他创立Neuralink,押注脑机接口——这也是AI与人类融合的极端路径之一。同年,特斯拉宣布全系标配Autopilot硬件,把自动驾驶的竞争提前了数年。
这一系列布局,展示出马斯克惊人的战略嗅觉。在大多数人还在没有脱离科幻谈论AI的时候,马斯克已经在三条不同赛道上同时落子。他无疑是AI时代最重要的预言者和启动者之一。
但这里有一个关键区别,值得从一开始就厘清:预见一件事的重要性,与理解这件事的内在机理,是两种截然不同的能力。
布洛克曼的证词,揭示出马斯克与OpenAI之间的分歧不仅是控制权之争,更是技术判断之争。
当时正是2017年,Transformer架构仅以论文的形式存在,GPT系列还在酝酿之中,强化学习和神经网络的研究路线众说纷纭。马斯克对技术的理解,在研究者眼中,充满直觉而又显得粗颗粒度。他喜欢的是“AI会不会杀死我们”这样的宏观命题来吸引公众的注意力,而不是“注意力机制为什么优于循环网络”这样的技术问题。
马斯克对AI的理解,是宏观的、上帝视角的、关于权力与风险分配的;他对AI的恐惧也许不是装出来的,他对AI重要性的判断是超前的,但当具体到研究路径、模型架构、训练方法论时,他的理解止步于哪个方向更危险,而不是哪个方向更有效。
当年马斯克看到GPT-1时,称这项技术“愚蠢”,并说“互联网上的孩子们”都能做得更好。这番言论令一位OpenAI早期员工感到非常沮丧,他几乎因此几乎放弃AI研究。
布洛克曼认为,马斯克根本没有时间去弄懂AI。
2023年,马斯克创办xAI,推出Grok系列模型。这让我们可以更直接观察他不是真懂AI,不是通过他说什么,而是通过他用AI来做什么。
Grok模型在技术层面取得了实实在在的进步:Grok 4.1在LMArena的排名一度位居第一,Elo达到1483;Grok 4在数学和科学基准测试上进入全球前列。这说明xAI团队的研究能力不弱,当然也通过蒸馏从OpenAI那里学到了不少。
马斯克在X上频繁展示Grok在意识形态话题上的“去政治正确”表现,喜欢晒出大量AI生成的美女图,着力推广模仿维基百科的Grokipedia, 所以这些颇能显示出他的AI品味。
对于马斯克来说,Grok似乎首先是一个政治和叙事工具,其次才是认知工具。这种定位,与真正深入理解AI系统能力的人,有着本质的差异。
2025年,马斯克用122天在孟菲斯建成了Colossus超算集群,这一基础设施成就令整个行业瞠目。他随后将其扩展至55万块英伟达H100/H200 GPU,宣称拥有全球最大的AI训练集群。
最近,The Information的报道戳破了这个故事。xAI的MFU(模型浮点利用率)只有11%。Meta和谷歌的同一指标是43%至46%。即便当年效率并不高的GPT-3训练,MFU也维持在21%至26%左右。xAI总裁尼科尔斯(Michael Nicolls)在内部备忘录中说这个数字“低得令人难堪”(embarrassingly low),并设定了提升至50%的目标。
要把55万块GPU的利用率从11%提升到行业水平的40%,需要的不是更多的硬件,而是分布式训练系统的软件成熟度、数据流水线的精细调优、通信拓扑的深度优化、以及对GPU集群行为的系统级理解。这是谷歌和Meta花费十年才积累起来的能力,无法通过购买更多硬件来跳过。
马斯克搞AI基础设施,用的是SpaceX放卫星的方式:资源堆砌,速度优先,宣示领先。但硬件堆砌能解决的问题,在AI系统的现实里越来越小。真正的竞争壁垒,正在向软件栈和系统效率迁移。
结果是xAI开始把Colossus的闲置算力出租给Cursor等第三方,用别人的工作负载填补自己大量闲置的集群。
但马斯克还要堆砌更大的AI基础设施。他最近宣布了Terafab计划,由Tesla、SpaceX和xAI联合建设,目标是每年生产1太瓦AI算力,采用2纳米制程,初期投资数百亿美元。他称之为“史上最宏大的造芯计划”,并宣布产能的80%将部署在太空轨道数据中心。
半导体制造是人类历史上最复杂的工业系统,它的核心竞争力不是资金,而是数十年的工艺经验、良率积累和隐性知识,这些都不是砸钱能掌握的。
发布仅一个月后,TeraFab就宣布引入Intel 14A制程技术。原本自己造芯片的叙事,悄悄变成了用Intel代工。
4680电池也是一个先例。2020年,马斯克在电池日上宣布,干法电极工艺将使电池成本削减50%,一年内产能达到10 GWh。五年后,4680项目屡屡延期,干法电极工艺经历了六七次重大修改。Tesla自己的顶级电池供应商公开表示:马斯克不懂怎么造电池。
从4680到Colossus到Terafab,呈现出马斯克的一贯套路:以宏大的制造业叙事掩盖对系统复杂性的低估,以极端速度完成硬件部署,然后在软件/工艺/系统层面陷入漫长的瓶颈。
贯穿所有这些案例的,不是能力问题,而是马斯克认知结构。
资源是约束,速度是武器,规模是壁垒,马斯克在SpaceX和Tesla中锻造出来的这套方法,在火箭和汽车领域奏效,因为核心瓶颈确实是物理约束——材料、推力、产能。
但AI、芯片制造、机器学习系统,面对的是复杂系统的涌现性问题。在这个领域,投入更多资源不会线性地产出更高效率;更快的速度反而可能跳过必要的迭代积累;规模在系统不成熟时是负担而非武器。
他的另一个套路是宏大叙事优先。他对AI的真实兴趣,更多在于它作为文明级工具的意义,而不是它的技术机理。这使他能够比任何人都更早感知到AI的重要性,但也使他在面对具体的工程问题时,倾向于用叙事代替理解,用规模代替深度。
业内人士也发现,马斯克公司的核心技术突破,往往来自他能够吸引的顶级人才,而不是他本人的技术判断。SpaceX有Tom Mueller,Tesla有JB Straubel,xAI有一批顶级研究员。他真正懂的,是识别和说服这些人。当这些人离开时,当xAI的联合创始人们陆续出走时,马斯克的公司就会开始暴露出他本人认知边界的真实轮廓。
话虽如此,马斯克依然是这个AI时代的主要设计师之一。
他在FSD上的坚持,推动了业界对纯视觉自动驾驶路线的重新评估。他对AI安全风险的持续警告,虽有时带有政治色彩,但客观上推动了AI治理讨论的提前展开。他创立OpenAI时投入的资源和信誉,是这家后来改变世界的机构能够起步的重要条件。他建造Colossus的速度,即便利用率只有11%,也迫使整个行业重新思考数据中心建造的可能速度。
不管别人怎么说,马斯克依然是AI的“懂王”。
开云入口,球友会app下载,
开云app下载相关资讯:千亿球友会官网,