女排联赛战火重燃津沪焦点对决疫苗将出口世界

作者：程德敏编辑：董泽左来源：j9真人会发布：2026-06-02 04:27:35

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

（来源：钛媒体APP）

“计算就是收入、瓦特就是收入、每一个token都是收入！”

以上言论，均出自黄仁勋在GTC 2026上的演讲。其内容堪称AI时代的“时间就是金钱”。

黄仁勋表示，每瓦特产生的token越多，收入就越多。

他展示了一组数据，GitHub上的代码提交量在2026年前几个月增加了近三倍，全球3000万软件开发者创造的3万亿美元薪酬价值正在产生接近9万亿美元的生产力。

在这场GTC大会上，黄仁勋带来了许多新玩意。

最重磅的无疑是英伟达与微软联手设计的AI PC，第二样是为Agent时代打造的Vera及其完整生态，第三样是开源大模型Nemotron 3 Ultra，第四样是物理AI Cosmos 3以及基于它而诞生的参考人形机器人Isaac。

这些东西串起来，拼成了黄仁勋对未来十年计算模式的完整判断。

重新定义AI PC

黄仁勋说，微软与英伟达的合作将会重新定义AI PC这个概念。

黄仁勋在台上展示了RTX Spark。

RTX Spark是一台笔记本电脑，芯片叫N1X，英伟达和联发科一起做的。里面有Blackwell RTX GPU，6144个CUDA核心，第五代Tensor Core，支持FP4精度。还有定制的20核Grace CPU，通过NVLink-C2C芯片互联连接。配128GB统一内存，台积电3nm工艺，700亿个晶体管。

数字生物学、地震处理、天体物理等应用都可以运行。所有与CUDA相关的物理、生物学、基因组学、AI、计算机图形应用，以及Windows的应用，都可以运行。

这台电脑和传统笔记本最大的区别是，它能在本地跑Agent。黄仁勋说的Agent，就是能理解你说的话、能看屏幕、能读文件、能帮你干活的AI助手。以前这些AI都要连到云端才能用，现在可以直接在你的笔记本上跑。

黄仁勋说，过去40年你用电脑是启动应用、点击、输入。现在有了RTX Spark和Windows，你只需要问，电脑就会帮你完成工作。RTX Spark把英伟达 30年积累的所有技术，CUDA、RTX、AI平台，都放进了一颗芯片。本地Agent、前沿模型、创意工作流、RTX游戏，全都能在一台笔记本上跑。

这就是黄仁勋手中的个人AI电脑。

微软为RTX Spark做了深度平台优化。

实现了工作负载配置文件调度，让Windows调度器更高效地在所有20个核心上扩展工作负载。无论你是在查看邮件还是在本地运行Agent调试代码，Windows调度器都会确保你从CPU获得最佳性能和效率。

他们还启用了微软电源和热管理框架，在保持凉爽的同时最大化性能和功率。

为了实现RTX Spark上高达128GB的内存，微软提高了GPU可访问的系统内存上限，让高内存系统上的GPU可用内存增加，从而能够加载更大的本地AI模型或渲染更复杂的项目。

他们还增强了Windows在统一内存系统上管理共享内存区域页面大小的方式，确保在重负载工作负载下有更大的内存页面可用，同时让开发者能够灵活优化CPU和GPU之间的内存工作负载需求。

微软CEO萨提亚·纳德拉说，他们的目标是用Windows把无限的智能送到每个家庭、每张办公桌。。

OpenClaw和Hermes Agent这些开源Agent项目在GitHub和OpenRouter上的数据已经创了纪录，但一直没能大规模普及，原因是没法在用户的主力电脑上安全、私密地跑Agent。

英伟达和微软合作解决了这个问题。他们做了新的Windows安全原语和英伟达 OpenShell运行时，确保Agent在用户完全掌控下安全运行。

新的Windows提供身份、隔离、策略和端到端安全能力，用来原生构建和运行Agent。

英伟达OpenShell提供了一些自定义功能，比如让用户限制Agent能做什么，以及不能做什么，根据用户的隐私策略智能地把查询路由到本地模型，在发送到云端模型的查询中隐藏个人信息。

Hermes Agent和OpenClaw在他们的新Windows应用里用了这套安全和隐私层。这些应用让用户可以轻松安全地访问设备端Agent，这些Agent能在Windows应用里执行任务，推理跨应用工作流，生成图像和视频，写插件和应用代码，语义搜索本地文件。

黄仁勋现场演示了一个在RTX Spark上本地运行的Agent怎么帮他设计房子。Agent运行Open Shell沙盒，连接Hermes编排系统和云端Claude Sonnet。

它选地点，读概念草图、风格情绪板、文字需求和设计意图。Agent用笔记本上的工具，打开Rhino为场地建模，塑造地形、退界和建筑外壳，提出建筑形式，针对成本、舒适性和质量优化。

形式定好后，Agent生成内部布局、墙体和流线，房间成形。它随时调整，自动放置门窗和结构元素，自己发现和修正错误。批准后，Agent从Rhino导出模型，导入Blender，材质和对象属性完整转移。

它调材质，选镜头，Blender渲染房子。Agent用Flux模型生成多个视角和光照条件。

整个过程全部都由Agent自己完成。

这就是黄仁勋说的“新的PC”。以前你用电脑是打开软件、点鼠标、敲键盘。现在你可以直接告诉Agent你要干什么，它自己去操作各种软件完成任务。

RTX Spark不只是为Agent设计的，它也是一台完整的创作和游戏电脑。

你可以在上面通过OptiX和DLSS渲染超大的90GB 3D场景，用Blackwell解码器编辑12K 4:2:2视频，跑1200亿参数、100万token上下文的大语言模型，玩1440p分辨率、超过100帧的AAA游戏，支持光线追踪、DLSS和Reflex。

RTX Spark还会支持新的RTX能力，包括DLSS 4.5光线重建，用第二代transformer模型，会出现在Blender 5.3和几十款游戏里。还有RTX Video 4倍帧生成，会出现在ComfyUI里。

RTX Spark是笔记本。不过黄仁勋也宣布推出桌面和工作站版本DGX Spark。

768GB内存，可以跑万亿参数的大模型，20 petaflops算力，每秒8TB内存带宽，放在办公桌上。如果你是大语言模型开发者或Agent开发者，可以在本地训练和测试模型，需要部署时再把模型放到云端。

黄仁勋说，想想15到20年前的电话。今天的手机，打电话不是最常用的功能。手机的意义完全不同了。PC也会经历类似变化。十年后的PC不会只是用来打开软件、点鼠标的工具。

ASUS、Dell、HP、Lenovo、微软Surface和MSI今年秋季会推出RTX Spark驱动的超薄Windows笔记本和紧凑型台式PC，全天候电池续航和优质显示屏。Acer和GIGABYTE的型号随后推出。黄仁勋没说具体价格。

Vera Rubin和AI工厂

随后，黄仁勋宣布，Vera Rubin已经全面投入生产。

Vera Rubin是是一套五机架规模的AI超级计算机系统，专门为跑Agent设计。

第一种是Vera Rubin NVL72，负责提示理解、上下文处理、推理和规划，这是Agent的“大脑”。

第二种是Vera CPU机架，单个液冷机架里装256颗Vera CPU，负责协调模型、管理内存、调用工具。

第三种是Groq 3 LPX机架，256个 Groq 3 LPU横跨16个托架，每秒40PB的SRAM 带宽，提供超低延迟的 Token 生成。NVL72负责高吞吐，Groq LPU负责低延迟。

第四种是Vera BlueField-4 STX 存储机架，这是Agent保存记忆的地方，负责存储处理、加速和片上安全。

第五种是 NVIDIA Spectrum-X Ethernet CPO 网络机架，配备共封装光学技术的以太网交换机，200Gb/s SerDes，和台积电合作做芯片级封装和超高功率磷化铟激光模块。

Vera Rubin由七颗新芯片组成。台积电3nm制程，CoWoS-L封装技术，HBM内存来自Micron、SK hynix和Samsung。一块Vera Rubin计算板上有万亿级晶体管和超过18000个元件。

整个机架包含18个计算托盘、9个热插拔NVLink交换托盘、高效液冷歧管和汇流排。液冷汇流排可以承载超过5000安培电流，相当于20台电动汽车全速加速时的电流。总共130万个元件构成第三代MGX机架设计。

和上一代Grace Blackwell相比，Vera Rubin在处理Agent任务时的吞吐量提升了10倍。

黄仁勋说，他们为Vera Rubin创造的供应链规模是Grace Blackwell的两倍。

以前组装一个Grace Blackwell机架需要两小时，现在Vera Rubin只需要五分钟。原因是设计改了。过去机架里有很多线缆和软管，现在用PCB中板直接连接两侧，不再需要线缆、软管和风扇。全部液冷，模块化设计，热插拔。

黄仁勋说，以前做Hopper时，最重要的工作是预训练。到Grace Blackwell，重点是推理。

“很多人说推理很简单，但推理就是钱。”

模型越来越复杂，要在高响应速度、快速交互和高吞吐下同时完成推理很困难。这就是NVLink 72的意义。

黄仁勋说，今天英伟达的token成本比竞争对手低一个数量级，因为他们做了协同设计，理解了推理的计算模式。

现在到了Agent时代，Agent不只是生成答案，它要观察、推理、规划、用工具，管理大量上下文，处理工作记忆和长期记忆，衍生出专家子Agent。Vera Rubin就是为这种工作才诞生的。

Vera Rubin平台引入了英伟达 Spectrum-X以太网光子学，这是世界上第一个基于共封装光学技术的交换机，有200Gb/s SerDes，如今已经投产。

共封装光学是什么？

传统网络交换机用可插拔收发器，收发器插在交换机外面，需要额外的功率、散热和空间。共封装光学把光学模块直接封装在交换机芯片上，和台积电合作做芯片级封装。

这带来三个好处。第一是能效提升5倍，因为光学模块和芯片之间的距离缩短了，信号损耗更小。第二是AI正常运行时间延长5倍，因为减少了可插拔部件的故障点。第三是部署时间缩短三分之一，因为简化了设计，为计算释放了更多功率。

CoreWeave、Lambda和Oracle Cloud Infrastructure是首批采用共封装光学网络的合作伙伴。Lambda在博客中展示了英伟达首批共封装光学样品的开箱。黄仁勋说，通过简化设计为计算释放更多功率，英伟达共封装光学网络为百万GPU AI工厂提供了基础架构。

Vera Rubin平台还集成了英伟达BlueField-4 DPU。

BlueField-4有高达800Gb/s速度的软件定义网络和内置多租户隔离。借助英伟达 BlueField-4 Advanced Secure Trusted Resource Architecture，客户可以简化网络操作，改善租户隔离，在百万GPU AI集群中获得更大控制。

AI工厂越来越多地在Agent工作流中处理专有数据、受监管内容和关键任务模型。这需要针对共享或云环境中自主Agent定制的基础设施安全性，因为基础设施不能被隐式信任。

Vera Rubin平台设计了全栈英伟达机密计算，用于机架规模的可信执行环境。Vera Rubin NVL72把Vera CPU、Rubin GPU、英伟达 NVLink网络和安全功能结合到统一平台中，在高速互连之间加密数据。这提供硬件级认证，确保系统防篡改。

在POD规模提供这种级别的保护还需要可编程软件层，能在整个系统中执行、编排和调整安全策略。英伟达DOCA软件平台在每个Vera Rubin平台机架和AI工厂层提供安全性，通过直接在BlueField-4硅中执行的能力保护数据、Agent、上下文内存和AI推理。

DOCA能做什么。它实现多租户网络隔离、零信任策略执行、运行时威胁检测和高达800Gb/s速度的端到端加密，这些都不占用主机CPU资源，所以企业可以放心扩展AI工厂。

英伟达DSX平台为Vera Rubin AI工厂提供完整的设计和运营基础。DSX统一了参考设计、仿真、基础设施软件、设施和生态系统技术，帮助构建和运营针对最低token成本优化的节能AI工厂。

DSX是什么。黄仁勋说，全球在建设AI工厂，这是大规模基础设施建设。AI工厂复杂度高，芯片、机架、网络、电力、冷却、电网，每一层都必须从端到端一起设计，因为计算就是收入。英伟达 DSX就是蓝图，是建设和运营AI工厂的参考设计，目标是高效率和高盈利能力。

DSX为Vera Rubin POD架构构建，对齐堆栈的每一层，从硅和系统到生命周期管理和多租户操作，加快部署，提高规模运营可靠性和弹性。

Dell Technologies、HPE、Lenovo和Supermicro以及ASUS、Foxconn、GIGABYTE、Pegatron、Quanta Cloud Technology、Wistron和Wiwynn在采用英伟达 DSX来加速Vera Rubin的AI工厂建设。

DSX包含三个部分。第一是DSX Sim。Omniverse Blueprint合作伙伴可以在第一台机架到场前就设计并验证一座英伟达 Rubin AI工厂。他们可以规划布局，模拟电力和冷却，设计网络，在数字孪生中验证每次集成测试和每次变更。第二是DSX OS。工厂通电后，DSX OS接管运营，提供监控和修复基础设施，把已安装系统变成多租户、弹性、AI就绪容量。第三是DSX Max-Q。

DSX Max-Q是什么。今天的AI工厂常常把电力过度配置40%，因为担心峰值负载。DSX Max-Q可以让运营商在相同电力预算下部署更多GPU。它有几个技术。温液冷却可以在45摄氏度下运行，用更少的水和能源，把更多能源留给计算。动态电力分配可以把机架电力导向需要工作的地方，回收闲置瓦特。机架内部的电力平滑机制可以削平峰值电流和电涌。

贯穿整座工厂，AIAgent工作团队会通过DSX Max-Q持续协调，平衡冷却、电力和工作负载需求。DSX AI工厂还是弹性能量资产，可以和电网协同工作。DSX Flex能读实时电网信号，在电网需要缓解压力时动态调整工厂电力。

黄仁勋说，到本十年结束前会有100GW的AI工厂上线。由英伟达 DSX运营的AI工厂会以最高效率生产最低成本的token。

Vera Rubin什么时候可以买到。生产出货从今年秋季开始。

黄仁勋说，过去英伟达是一家GPU公司。这些年来他们演进成系统公司。现在看到的是英伟达最复杂的系统。

最终客户和合作伙伴不是想买一台计算机，他们想建设AI工厂。

正因如此英伟达在再次转型。技术现在延伸到基础设施尺度。

合作伙伴包括发电、冷却、电网供应商和工业基础设施公司。他们在努力构建完整的堆栈，就像为GPU、Grace Blackwell、NVLink 72做的那样。现在他们在构建完整的基础设施系统，让客户可以建设AI基础设施。

每个千兆瓦级AI工厂投入都从200亿、300亿美元开始，很快会达到每千兆瓦800亿到1000亿美元。1000亿美元投入AI工厂，它必须第一次就能工作，而且必须立刻成功。

资本成本高，复杂度也高。就像设计芯片时会先在计算机里模拟芯片、再模拟整个系统一样，现在也把AI工厂建在Omniverse里。可以在数字世界里建造这些系统，在现实世界动工前就完成验证。

RTX是GPU，DGX是系统，现在DSX是基础设施。

它包括系统和软件，让英伟达能和公司合作，把它们变成AI云。比如CoreWeave，最近它的价值已经达到数百亿美元，在增长。

这些公司服务各自区域，也服务全球客户。AI会无处不在，每家公司都会由AI驱动，每个地区都会建设自己的AI能力。它们需要完整的计算栈，硬件、软件、库，还有和第三方生态、第三方开发者连接的能力。

帮客户建设和部署AI工厂很重要。原因是计算就是收入，现在计算就是利润。没有收入、没有利润就会变成亏损。黄仁勋说，这就是为什么英伟达是重要伙伴。他们创造完整基础设施，把每件东西连接起来，进行了验证，确保正常运转。

time to first token更快，推理启动更快，从推理转向训练也更快。每瓦产生的token比较多。因为把一切都整合起来，从头设计、模拟整个系统，进行协同设计。可靠性也很重要。大型数据中心有数百万条电缆和无数活动部件，要让这些计算机和谐工作很困难。英伟达长期运行超大规模系统，这些经验很重要。

最后是产品寿命。

几年前Hopper时代的AI已经和今天完全不同。六年前Ampere时代还在谈CNN，后来谈Transformer，再后来谈专家混合，现在谈Agent系统。每隔几个月软件行业就会出现新技术。

如果架构不灵活，生态系统不丰富，资产寿命就不会长。因为全球软件开发者都在用英伟达 CUDA，所以英伟达 CUDA生态的资产寿命会更长。也可以从成本的另一面理解，如果资产寿命长，总拥有成本就低。这就是差异。

黄仁勋说，买得越多，赚得越多。

全球的工厂和员工都在拼命工作，因为全世界都想赚钱。大家已经意识到，有用的AI到来了，可盈利的AI到来了，计算需求高得惊人，需求本身就是限制。

各种大模型

黄仁勋今天还发布了开源大模型Nemotron 3 Ultra。

Nemotron是英伟达为世界构建的专用开源模型，专门为Agent工作负载设计。

和其他开源模型不同，Nemotron不只给你模型，还给你训练模型所用的数据。

Nemotron针对长时间推理、长时间运行的工具任务、工具使用和任务解决进行训练，是世界上最大的长时程推理模型之一。模型、训练脚本和数据都对你开源。黄仁勋说，这是开源模型的最佳形态，让你可以拿走它，继续添加数据，让它变得更好，并成为你自己的模型。

Nemotron 3 Ultra主要有三个优势，第一是速度快近五倍。

它是世界上第一批基于混合架构的模型之一，结合了状态空间模型SSM与专家混合MoE。这种架构速度极快。黄仁勋说，更快意味着你能用相同成本思考更久。

第二是降低约30%运行成本。

第三是完全开源，包括模型、训练脚本和数据。

那么Nemotron 3 Ultra到底是干嘛用的呢？黄仁勋说了这么一个案例。

他说英伟达现在做芯片太复杂了，要靠工程师一行行查、一轮轮跑验证，太慢也太贵。

因为每颗AI芯片里有海量的晶体管，每条线路、每个逻辑门都必须严丝合缝，只要一个小错误，就可能让整颗芯片延期几个月。

所以英伟达和Cadence做了一个“芯片设计AI助手团队”。

这个团队是一组会干活的Agent。

它能读芯片设计规格，写或修改RTL代码，自动生成测试用例，调用Cadence的仿真工具Xcelium跑模拟，再用Jasper做形式化验证。发现Bug后，它还能定位问题、改代码、再跑一遍验证。

这里面大概是这样分工：

Codex像项目经理，负责调度整个流程。

Nemotron像技术大脑，负责推理、判断、推进验证循环。

Cadence工具栈像专业仪器，负责真正跑芯片仿真和验证。

Open Shell像安全沙箱，确保Agent在受控环境里工作，不乱改、不乱跑。

一堆专家子Agent则分别负责写RTL、建测试平台、跑回归测试、调试Bug。

以前芯片验证要工程师手动反复做，周期可能是几周；现在英伟达想让AI Agent自动接管一部分流程，把“写代码、跑仿真、找Bug、修Bug、再验证”变成自动循环，把芯片设计验证从几周压到几小时。

与此同时，黄仁勋搬出了英伟达最前沿的物理AI Cosmos 3。

黄仁勋说，语言模型领域有很多人在做，而在物理AI方面，我们绝对是全球最强之一。“我为我们的团队感到骄傲。”

黄仁勋说：“对于语言模型，我们可以使用互联网上的英语和各种语言文本训练，因为这些内容来自人类写作和阅读。但要为机器人构建数据，数据必须来自感知，来自机器人的视角。而世界上大多数视频数据都是第三人称视角，不是第一人称视角。因此，对Agent系统、机器人系统、物理AI来说，数据是最难解决的问题。”

英伟达想解决一个问题：机器人太缺训练数据了。

训练语言模型，可以用互联网上的文字；但训练机器人不一样。机器人要学会走路、抓东西、开车、避障、在工厂里干活，它需要理解真实世界里的空间、动作、物体和物理规律。

可问题是，真实世界的数据很难收集。你不可能让机器人在现实里无限试错，因为太慢、太贵，也可能有危险。

所以黄仁勋的思路是，先让人远程操控机器人，给它做示范。

再用Omniverse做仿真，在虚拟世界里生成更多训练场景。

再把普通视频里的第三人称视角，转换成机器人自己的第一人称视角。

最后，用Cosmos这种世界模型，让AI自己理解和生成物理世界的数据。

Cosmos可以理解视频里发生了什么，也可以根据文字、图片、视频生成符合物理规律的新视频。比如你给它一个场景，它可以预测下一秒会发生什么；你让它模拟机器人抓杯子，它可以生成这个动作过程；你让它训练自动驾驶，它可以制造各种道路情况。

所以黄仁勋才说“计算就是数据”，以前数据只能从现实世界采集，现在可以用计算生成。只要模型足够强，计算机就能模拟真实世界，给机器人制造大量训练材料。

这对物理AI很重要，因为机器人需要的不是会聊天的AI，而是懂现实世界怎么运转的AI。

基于此，英伟达做了一个“人形机器人标准套件”，叫Isaac GR00T。

为什么要做这个？因为做人形机器人太难了。一个机器人身上有很多电机、传感器、控制系统，还要有训练数据、仿真环境、操作系统、AI模型和部署工具。以前每个研究团队都要从零开始拼这些东西，光搭环境就可能花几个月，真正研究还没开始，人已经累半死。

所以英伟达说：我们直接给大家做一个参考平台。

这个平台不只是一个机器人硬件，而是一整套东西：

有机器人本体；有运行机器人的Jetson Thor计算平台；有AI模型；有仿真工具Isaac Lab；有远程操作工具Isaac Teleop；有Omniverse和Cosmos来生成合成数据；有训练和评估环境；有Isaac ROS负责部署到真实机器人上。

你可以把它理解成机器人界的“开发样机+操作系统+训练工具包”。

研究者拿到GR00T之后，不用从零开始造机器人、搭仿真、接传感器、写底层系统，而是可以直接开始训练机器人做任务。比如让机器人学会抓东西、搬运、走路、在工厂里工作。你可以用英伟达的全套组件，也可以只用其中一部分，把自己的模型、传感器或控制系统换进去。

黄仁勋说它有25个身体自由度，每只手31个自由度，身高大约6英尺，体重150磅，就是想说明它是一个接近真人尺寸、能做复杂动作的人形机器人参考设计。

开云在线，老哥俱乐部，

开云体育相关资讯：老哥俱乐部九游会，

原标题：基金经理中长期看好管理方式才是矛盾爆发真原因？ | 稿源：j9.com | 责任编辑：邓玲玲

李艾科如履薄冰《九阴真经》疑似作者墓被发现

站内推荐

李艾科如履薄冰 《九阴真经》疑似作者墓被发现

相关新闻

站内推荐

李艾科如履薄冰《九阴真经》疑似作者墓被发现