炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:钛媒体APP)
“计算就是收入、瓦特就是收入、每一个token都是收入!”
以上言论,均出自黄仁勋在GTC 2026上的演讲。其内容堪称AI时代的“时间就是金钱”。
黄仁勋表示,每瓦特产生的token越多,收入就越多。
他展示了一组数据,GitHub上的代码提交量在2026年前几个月增加了近三倍,全球3000万软件开发者创造的3万亿美元薪酬价值正在产生接近9万亿美元的生产力。

在这场GTC大会上,黄仁勋带来了许多新玩意。
最重磅的无疑是英伟达与微软联手设计的AI PC,第二样是为Agent时代打造的Vera及其完整生态,第三样是开源大模型Nemotron 3 Ultra,第四样是物理AI Cosmos 3以及基于它而诞生的参考人形机器人Isaac。
这些东西串起来,拼成了黄仁勋对未来十年计算模式的完整判断。
重新定义AI PC
黄仁勋说,微软与英伟达的合作将会重新定义AI PC这个概念。
黄仁勋在台上展示了RTX Spark。
RTX Spark是一台笔记本电脑,芯片叫N1X,英伟达和联发科一起做的。里面有Blackwell RTX GPU,6144个CUDA核心,第五代Tensor Core,支持FP4精度。还有定制的20核Grace CPU,通过NVLink-C2C芯片互联连接。配128GB统一内存,台积电3nm工艺,700亿个晶体管。
数字生物学、地震处理、天体物理等应用都可以运行。所有与CUDA相关的物理、生物学、基因组学、AI、计算机图形应用,以及Windows的应用,都可以运行。

这台电脑和传统笔记本最大的区别是,它能在本地跑Agent。黄仁勋说的Agent,就是能理解你说的话、能看屏幕、能读文件、能帮你干活的AI助手。以前这些AI都要连到云端才能用,现在可以直接在你的笔记本上跑。
黄仁勋说,过去40年你用电脑是启动应用、点击、输入。现在有了RTX Spark和Windows,你只需要问,电脑就会帮你完成工作。RTX Spark把英伟达 30年积累的所有技术,CUDA、RTX、AI平台,都放进了一颗芯片。本地Agent、前沿模型、创意工作流、RTX游戏,全都能在一台笔记本上跑。
这就是黄仁勋手中的个人AI电脑。
微软为RTX Spark做了深度平台优化。
实现了工作负载配置文件调度,让Windows调度器更高效地在所有20个核心上扩展工作负载。无论你是在查看邮件还是在本地运行Agent调试代码,Windows调度器都会确保你从CPU获得最佳性能和效率。
他们还启用了微软电源和热管理框架,在保持凉爽的同时最大化性能和功率。
为了实现RTX Spark上高达128GB的内存,微软提高了GPU可访问的系统内存上限,让高内存系统上的GPU可用内存增加,从而能够加载更大的本地AI模型或渲染更复杂的项目。
他们还增强了Windows在统一内存系统上管理共享内存区域页面大小的方式,确保在重负载工作负载下有更大的内存页面可用,同时让开发者能够灵活优化CPU和GPU之间的内存工作负载需求。
微软CEO萨提亚·纳德拉说,他们的目标是用Windows把无限的智能送到每个家庭、每张办公桌。。
OpenClaw和Hermes Agent这些开源Agent项目在GitHub和OpenRouter上的数据已经创了纪录,但一直没能大规模普及,原因是没法在用户的主力电脑上安全、私密地跑Agent。
英伟达和微软合作解决了这个问题。他们做了新的Windows安全原语和英伟达 OpenShell运行时,确保Agent在用户完全掌控下安全运行。
新的Windows提供身份、隔离、策略和端到端安全能力,用来原生构建和运行Agent。
英伟达OpenShell提供了一些自定义功能,比如让用户限制Agent能做什么,以及不能做什么,根据用户的隐私策略智能地把查询路由到本地模型,在发送到云端模型的查询中隐藏个人信息。
Hermes Agent和OpenClaw在他们的新Windows应用里用了这套安全和隐私层。这些应用让用户可以轻松安全地访问设备端Agent,这些Agent能在Windows应用里执行任务,推理跨应用工作流,生成图像和视频,写插件和应用代码,语义搜索本地文件。
黄仁勋现场演示了一个在RTX Spark上本地运行的Agent怎么帮他设计房子。Agent运行Open Shell沙盒,连接Hermes编排系统和云端Claude Sonnet。
它选地点,读概念草图、风格情绪板、文字需求和设计意图。Agent用笔记本上的工具,打开Rhino为场地建模,塑造地形、退界和建筑外壳,提出建筑形式,针对成本、舒适性和质量优化。
形式定好后,Agent生成内部布局、墙体和流线,房间成形。它随时调整,自动放置门窗和结构元素,自己发现和修正错误。批准后,Agent从Rhino导出模型,导入Blender,材质和对象属性完整转移。
它调材质,选镜头,Blender渲染房子。Agent用Flux模型生成多个视角和光照条件。
整个过程全部都由Agent自己完成。
这就是黄仁勋说的“新的PC”。以前你用电脑是打开软件、点鼠标、敲键盘。现在你可以直接告诉Agent你要干什么,它自己去操作各种软件完成任务。
RTX Spark不只是为Agent设计的,它也是一台完整的创作和游戏电脑。
你可以在上面通过OptiX和DLSS渲染超大的90GB 3D场景,用Blackwell解码器编辑12K 4:2:2视频,跑1200亿参数、100万token上下文的大语言模型,玩1440p分辨率、超过100帧的AAA游戏,支持光线追踪、DLSS和Reflex。
RTX Spark还会支持新的RTX能力,包括DLSS 4.5光线重建,用第二代transformer模型,会出现在Blender 5.3和几十款游戏里。还有RTX Video 4倍帧生成,会出现在ComfyUI里。
RTX Spark是笔记本。不过黄仁勋也宣布推出桌面和工作站版本DGX Spark。

768GB内存,可以跑万亿参数的大模型,20 petaflops算力,每秒8TB内存带宽,放在办公桌上。如果你是大语言模型开发者或Agent开发者,可以在本地训练和测试模型,需要部署时再把模型放到云端。
黄仁勋说,想想15到20年前的电话。今天的手机,打电话不是最常用的功能。手机的意义完全不同了。PC也会经历类似变化。十年后的PC不会只是用来打开软件、点鼠标的工具。
ASUS、Dell、HP、Lenovo、微软Surface和MSI今年秋季会推出RTX Spark驱动的超薄Windows笔记本和紧凑型台式PC,全天候电池续航和优质显示屏。Acer和GIGABYTE的型号随后推出。黄仁勋没说具体价格。
Vera Rubin和AI工厂
随后,黄仁勋宣布,Vera Rubin已经全面投入生产。
Vera Rubin是是一套五机架规模的AI超级计算机系统,专门为跑Agent设计。

第一种是Vera Rubin NVL72,负责提示理解、上下文处理、推理和规划,这是Agent的“大脑”。
第二种是Vera CPU机架,单个液冷机架里装256颗Vera CPU,负责协调模型、管理内存、调用工具。
第三种是Groq 3 LPX机架,256个 Groq 3 LPU横跨16个托架,每秒40PB的SRAM 带宽,提供超低延迟的 Token 生成。NVL72负责高吞吐,Groq LPU负责低延迟。
第四种是Vera BlueField-4 STX 存储机架,这是Agent保存记忆的地方,负责存储处理、加速和片上安全。
第五种是 NVIDIA Spectrum-X Ethernet CPO 网络机架,配备共封装光学技术的以太网交换机,200Gb/s SerDes,和台积电合作做芯片级封装和超高功率磷化铟激光模块。
Vera Rubin由七颗新芯片组成。台积电3nm制程,CoWoS-L封装技术,HBM内存来自Micron、SK hynix和Samsung。一块Vera Rubin计算板上有万亿级晶体管和超过18000个元件。
整个机架包含18个计算托盘、9个热插拔NVLink交换托盘、高效液冷歧管和汇流排。液冷汇流排可以承载超过5000安培电流,相当于20台电动汽车全速加速时的电流。总共130万个元件构成第三代MGX机架设计。
和上一代Grace Blackwell相比,Vera Rubin在处理Agent任务时的吞吐量提升了10倍。
黄仁勋说,他们为Vera Rubin创造的供应链规模是Grace Blackwell的两倍。
以前组装一个Grace Blackwell机架需要两小时,现在Vera Rubin只需要五分钟。原因是设计改了。过去机架里有很多线缆和软管,现在用PCB中板直接连接两侧,不再需要线缆、软管和风扇。全部液冷,模块化设计,热插拔。
黄仁勋说,以前做Hopper时,最重要的工作是预训练。到Grace Blackwell,重点是推理。
“很多人说推理很简单,但推理就是钱。”
模型越来越复杂,要在高响应速度、快速交互和高吞吐下同时完成推理很困难。这就是NVLink 72的意义。
黄仁勋说,今天英伟达的token成本比竞争对手低一个数量级,因为他们做了协同设计,理解了推理的计算模式。
现在到了Agent时代,Agent不只是生成答案,它要观察、推理、规划、用工具,管理大量上下文,处理工作记忆和长期记忆,衍生出专家子Agent。Vera Rubin就是为这种工作才诞生的。
Vera Rubin平台引入了英伟达 Spectrum-X以太网光子学,这是世界上第一个基于共封装光学技术的交换机,有200Gb/s SerDes,如今已经投产。
共封装光学是什么?
传统网络交换机用可插拔收发器,收发器插在交换机外面,需要额外的功率、散热和空间。共封装光学把光学模块直接封装在交换机芯片上,和台积电合作做芯片级封装。
这带来三个好处。第一是能效提升5倍,因为光学模块和芯片之间的距离缩短了,信号损耗更小。第二是AI正常运行时间延长5倍,因为减少了可插拔部件的故障点。第三是部署时间缩短三分之一,因为简化了设计,为计算释放了更多功率。
CoreWeave、Lambda和Oracle Cloud Infrastructure是首批采用共封装光学网络的合作伙伴。Lambda在博客中展示了英伟达首批共封装光学样品的开箱。黄仁勋说,通过简化设计为计算释放更多功率,英伟达共封装光学网络为百万GPU AI工厂提供了基础架构。
Vera Rubin平台还集成了英伟达BlueField-4 DPU。

BlueField-4有高达800Gb/s速度的软件定义网络和内置多租户隔离。借助英伟达 BlueField-4 Advanced Secure Trusted Resource Architecture,客户可以简化网络操作,改善租户隔离,在百万GPU AI集群中获得更大控制。
AI工厂越来越多地在Agent工作流中处理专有数据、受监管内容和关键任务模型。这需要针对共享或云环境中自主Agent定制的基础设施安全性,因为基础设施不能被隐式信任。
Vera Rubin平台设计了全栈英伟达机密计算,用于机架规模的可信执行环境。Vera Rubin NVL72把Vera CPU、Rubin GPU、英伟达 NVLink网络和安全功能结合到统一平台中,在高速互连之间加密数据。这提供硬件级认证,确保系统防篡改。
在POD规模提供这种级别的保护还需要可编程软件层,能在整个系统中执行、编排和调整安全策略。英伟达DOCA软件平台在每个Vera Rubin平台机架和AI工厂层提供安全性,通过直接在BlueField-4硅中执行的能力保护数据、Agent、上下文内存和AI推理。
DOCA能做什么。它实现多租户网络隔离、零信任策略执行、运行时威胁检测和高达800Gb/s速度的端到端加密,这些都不占用主机CPU资源,所以企业可以放心扩展AI工厂。
英伟达DSX平台为Vera Rubin AI工厂提供完整的设计和运营基础。DSX统一了参考设计、仿真、基础设施软件、设施和生态系统技术,帮助构建和运营针对最低token成本优化的节能AI工厂。
DSX是什么。黄仁勋说,全球在建设AI工厂,这是大规模基础设施建设。AI工厂复杂度高,芯片、机架、网络、电力、冷却、电网,每一层都必须从端到端一起设计,因为计算就是收入。英伟达 DSX就是蓝图,是建设和运营AI工厂的参考设计,目标是高效率和高盈利能力。
DSX为Vera Rubin POD架构构建,对齐堆栈的每一层,从硅和系统到生命周期管理和多租户操作,加快部署,提高规模运营可靠性和弹性。
Dell Technologies、HPE、Lenovo和Supermicro以及ASUS、Foxconn、GIGABYTE、Pegatron、Quanta Cloud Technology、Wistron和Wiwynn在采用英伟达 DSX来加速Vera Rubin的AI工厂建设。
DSX包含三个部分。第一是DSX Sim。Omniverse Blueprint合作伙伴可以在第一台机架到场前就设计并验证一座英伟达 Rubin AI工厂。他们可以规划布局,模拟电力和冷却,设计网络,在数字孪生中验证每次集成测试和每次变更。第二是DSX OS。工厂通电后,DSX OS接管运营,提供监控和修复基础设施,把已安装系统变成多租户、弹性、AI就绪容量。第三是DSX Max-Q。
DSX Max-Q是什么。今天的AI工厂常常把电力过度配置40%,因为担心峰值负载。DSX Max-Q可以让运营商在相同电力预算下部署更多GPU。它有几个技术。温液冷却可以在45摄氏度下运行,用更少的水和能源,把更多能源留给计算。动态电力分配可以把机架电力导向需要工作的地方,回收闲置瓦特。机架内部的电力平滑机制可以削平峰值电流和电涌。
贯穿整座工厂,AIAgent工作团队会通过DSX Max-Q持续协调,平衡冷却、电力和工作负载需求。DSX AI工厂还是弹性能量资产,可以和电网协同工作。DSX Flex能读实时电网信号,在电网需要缓解压力时动态调整工厂电力。
黄仁勋说,到本十年结束前会有100GW的AI工厂上线。由英伟达 DSX运营的AI工厂会以最高效率生产最低成本的token。
Vera Rubin什么时候可以买到。生产出货从今年秋季开始。
黄仁勋说,过去英伟达是一家GPU公司。这些年来他们演进成系统公司。现在看到的是英伟达最复杂的系统。
最终客户和合作伙伴不是想买一台计算机,他们想建设AI工厂。
正因如此英伟达在再次转型。技术现在延伸到基础设施尺度。
合作伙伴包括发电、冷却、电网供应商和工业基础设施公司。他们在努力构建完整的堆栈,就像为GPU、Grace Blackwell、NVLink 72做的那样。现在他们在构建完整的基础设施系统,让客户可以建设AI基础设施。
每个千兆瓦级AI工厂投入都从200亿、300亿美元开始,很快会达到每千兆瓦800亿到1000亿美元。1000亿美元投入AI工厂,它必须第一次就能工作,而且必须立刻成功。
资本成本高,复杂度也高。就像设计芯片时会先在计算机里模拟芯片、再模拟整个系统一样,现在也把AI工厂建在Omniverse里。可以在数字世界里建造这些系统,在现实世界动工前就完成验证。
RTX是GPU,DGX是系统,现在DSX是基础设施。
它包括系统和软件,让英伟达能和公司合作,把它们变成AI云。比如CoreWeave,最近它的价值已经达到数百亿美元,在增长。
这些公司服务各自区域,也服务全球客户。AI会无处不在,每家公司都会由AI驱动,每个地区都会建设自己的AI能力。它们需要完整的计算栈,硬件、软件、库,还有和第三方生态、第三方开发者连接的能力。
帮客户建设和部署AI工厂很重要。原因是计算就是收入,现在计算就是利润。没有收入、没有利润就会变成亏损。黄仁勋说,这就是为什么英伟达是重要伙伴。他们创造完整基础设施,把每件东西连接起来,进行了验证,确保正常运转。
time to first token更快,推理启动更快,从推理转向训练也更快。每瓦产生的token比较多。因为把一切都整合起来,从头设计、模拟整个系统,进行协同设计。可靠性也很重要。大型数据中心有数百万条电缆和无数活动部件,要让这些计算机和谐工作很困难。英伟达长期运行超大规模系统,这些经验很重要。
最后是产品寿命。
几年前Hopper时代的AI已经和今天完全不同。六年前Ampere时代还在谈CNN,后来谈Transformer,再后来谈专家混合,现在谈Agent系统。每隔几个月软件行业就会出现新技术。
如果架构不灵活,生态系统不丰富,资产寿命就不会长。因为全球软件开发者都在用英伟达 CUDA,所以英伟达 CUDA生态的资产寿命会更长。也可以从成本的另一面理解,如果资产寿命长,总拥有成本就低。这就是差异。
黄仁勋说,买得越多,赚得越多。
全球的工厂和员工都在拼命工作,因为全世界都想赚钱。大家已经意识到,有用的AI到来了,可盈利的AI到来了,计算需求高得惊人,需求本身就是限制。
各种大模型
黄仁勋今天还发布了开源大模型Nemotron 3 Ultra。
Nemotron是 英伟达为世界构建的专用开源模型,专门为Agent工作负载设计。
和其他开源模型不同,Nemotron不只给你模型,还给你训练模型所用的数据。
Nemotron针对长时间推理、长时间运行的工具任务、工具使用和任务解决进行训练,是世界上最大的长时程推理模型之一。模型、训练脚本和数据都对你开源。黄仁勋说,这是开源模型的最佳形态,让你可以拿走它,继续添加数据,让它变得更好,并成为你自己的模型。
Nemotron 3 Ultra主要有三个优势,第一是速度快近五倍。
它是世界上第一批基于混合架构的模型之一,结合了状态空间模型SSM与专家混合MoE。这种架构速度极快。黄仁勋说,更快意味着你能用相同成本思考更久。
第二是降低约30%运行成本。
第三是完全开源,包括模型、训练脚本和数据。
那么Nemotron 3 Ultra到底是干嘛用的呢?黄仁勋说了这么一个案例。
他说英伟达现在做芯片太复杂了,要靠工程师一行行查、一轮轮跑验证,太慢也太贵。
因为每颗AI芯片里有海量的晶体管,每条线路、每个逻辑门都必须严丝合缝,只要一个小错误,就可能让整颗芯片延期几个月。
所以英伟达和Cadence做了一个“芯片设计AI助手团队”。
这个团队是一组会干活的Agent。
它能读芯片设计规格,写或修改RTL代码,自动生成测试用例,调用Cadence的仿真工具Xcelium跑模拟,再用Jasper做形式化验证。发现Bug后,它还能定位问题、改代码、再跑一遍验证。
这里面大概是这样分工:
Codex像项目经理,负责调度整个流程。
Nemotron像技术大脑,负责推理、判断、推进验证循环。
Cadence工具栈像专业仪器,负责真正跑芯片仿真和验证。
Open Shell像安全沙箱,确保Agent在受控环境里工作,不乱改、不乱跑。
一堆专家子Agent则分别负责写RTL、建测试平台、跑回归测试、调试Bug。
以前芯片验证要工程师手动反复做,周期可能是几周;现在英伟达想让AI Agent自动接管一部分流程,把“写代码、跑仿真、找Bug、修Bug、再验证”变成自动循环,把芯片设计验证从几周压到几小时。
与此同时,黄仁勋搬出了英伟达最前沿的物理AI Cosmos 3。

黄仁勋说,语言模型领域有很多人在做,而在物理AI方面,我们绝对是全球最强之一。“我为我们的团队感到骄傲。”
黄仁勋说:“对于语言模型,我们可以使用互联网上的英语和各种语言文本训练,因为这些内容来自人类写作和阅读。但要为机器人构建数据,数据必须来自感知,来自机器人的视角。而世界上大多数视频数据都是第三人称视角,不是第一人称视角。因此,对Agent系统、机器人系统、物理AI来说,数据是最难解决的问题。”
英伟达想解决一个问题:机器人太缺训练数据了。
训练语言模型,可以用互联网上的文字;但训练机器人不一样。机器人要学会走路、抓东西、开车、避障、在工厂里干活,它需要理解真实世界里的空间、动作、物体和物理规律。
可问题是,真实世界的数据很难收集。你不可能让机器人在现实里无限试错,因为太慢、太贵,也可能有危险。
所以黄仁勋的思路是,先让人远程操控机器人,给它做示范。
再用Omniverse做仿真,在虚拟世界里生成更多训练场景。
再把普通视频里的第三人称视角,转换成机器人自己的第一人称视角。
最后,用Cosmos这种世界模型,让AI自己理解和生成物理世界的数据。
Cosmos可以理解视频里发生了什么,也可以根据文字、图片、视频生成符合物理规律的新视频。比如你给它一个场景,它可以预测下一秒会发生什么;你让它模拟机器人抓杯子,它可以生成这个动作过程;你让它训练自动驾驶,它可以制造各种道路情况。
所以黄仁勋才说“计算就是数据”,以前数据只能从现实世界采集,现在可以用计算生成。只要模型足够强,计算机就能模拟真实世界,给机器人制造大量训练材料。
这对物理AI很重要,因为机器人需要的不是会聊天的AI,而是懂现实世界怎么运转的AI。
基于此,英伟达做了一个“人形机器人标准套件”,叫Isaac GR00T。
为什么要做这个?因为做人形机器人太难了。一个机器人身上有很多电机、传感器、控制系统,还要有训练数据、仿真环境、操作系统、AI模型和部署工具。以前每个研究团队都要从零开始拼这些东西,光搭环境就可能花几个月,真正研究还没开始,人已经累半死。
所以英伟达说:我们直接给大家做一个参考平台。
这个平台不只是一个机器人硬件,而是一整套东西:
有机器人本体;有运行机器人的Jetson Thor计算平台;有AI模型;有仿真工具Isaac Lab;有远程操作工具Isaac Teleop;有Omniverse和Cosmos来生成合成数据;有训练和评估环境;有Isaac ROS负责部署到真实机器人上。
你可以把它理解成机器人界的“开发样机+操作系统+训练工具包”。
研究者拿到GR00T之后,不用从零开始造机器人、搭仿真、接传感器、写底层系统,而是可以直接开始训练机器人做任务。比如让机器人学会抓东西、搬运、走路、在工厂里工作。你可以用英伟达的全套组件,也可以只用其中一部分,把自己的模型、传感器或控制系统换进去。
黄仁勋说它有25个身体自由度,每只手31个自由度,身高大约6英尺,体重150磅,就是想说明它是一个接近真人尺寸、能做复杂动作的人形机器人参考设计。
开云在线,老哥俱乐部,
开云体育相关资讯:老哥俱乐部九游会,