专题:获利盘回吐压力显现 中期上行趋势不改
炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

中信证券研究 文|许英博 连一席 杨皓天
北美学术泰斗李飞飞、杨立昆近期分别融资10亿美元,押注世界模型,引发市场高度关注。向前追溯,英伟达、Google、OpenAI等AI巨头也将世界模型作为通往下一代智能的潜在路线。然而,世界模型尚无统一定义,Sora、英伟达、李飞飞、杨立昆四大技术路线的对世界模型的诠释各有不同。因此,本篇报告试图回答以下三个基本问题:1)什么是世界模型?2)世界模型各个流派的差异是什么?3)世界模型有哪些应用场景?
▍为什么关注世界模型?全球科技巨头押注,赛道迎来高速发展期。
2026年3月16日GTC大会期间,英伟达Cosmos世界模型再度重磅登场。该模型已连续2年亮相CES和GTC两大峰会。2月19日,李飞飞创立的World Labs宣布完成最新一笔10亿美元的融资,专注于世界模型研发。3月10日,杨立昆创立的AMI宣布完成10.3亿美元融资,创欧洲AI领域种子轮融资规模纪录。OpenAI Sora、Google Genie等模型也被视为世界模型领域的有力竞争者。全球顶尖学者、头部科技厂商的重兵布局,叠加多模态模型能力的迅速迭代,世界模型已逐步汇聚起引领下一代人工智能发展的产业共识。
▍什么是世界模型?尚无统一定义,Sora、英伟达、李飞飞、杨立昆四大技术路线各有侧重,共同构筑世界模型的主流探索方向。
以Sora为代表的视频生成派、以英伟达为代表的物理AI派、以李飞飞代表的空间智能派、以杨立昆为代表的因果推演派,对世界模型的定位各有不同:
1)视频生成派认为,世界模型是能够自由想象的像素级视频生成器;
2)物理AI派认为,世界模型是能够批量生成仿真环境的物理AI基础设施;
3)空间智能派认为,世界模型是能够理解物体三维空间关系的3D空间智能;
4)因果推演派认为,世界模型是能够在抽象逻辑中,进行物理规律因果推理与未来推演的因果推演智能。
四大流派分别从四个方向开启下一代AI的长征,期望会师于世界模型这个终极目标,从而补足语言模型在视觉生成能力、动作交互能力、空间理解能力和因果推演能力的短板,引领下一代人工智能发展。


▍世界模型各个流派的差异是什么?四大流派的研究视角和技术侧重不同,但核心本质一脉相通。
视频生成派强调对世界的像素级还原,物理AI派强调对世界真实场景的还原,空间智能派强调对于世界的3D还原,而因果推演派强调对于抽象的因果逻辑还原。四大方向仅是从不同维度刻画世界模型的能力边界,彼此并非完全对立排斥的技术路线。在产业发展过程中,各流派技术也在持续迭代融合、相互借鉴、优势互补。最终,世界模型可以形成统一的数学抽象表示,即给定世界上一刻的状态和动作,生成下一刻的状态。例如,给定视频的上一刻的画面,和视频画面中机器人的动作,预测视频的下一刻的画面。相比于语言模型基于历史的Token生成下一个Token的范式,世界模型的不同之处在于,Token是视频模态,并且引入了动作。世界模型本质上强调的是机器人如何改变世界。

▍世界模型有哪些落地场景?视频生成、互动游戏、设计、XR/AR和物理AI,其中物理AI是最重要的落地场景。
世界模型当前主要有五类应用:视频生成、互动游戏、互动设计、XR/AR和物理AI。从落地的节奏看,可以分为:
1)已初步落地的商业化产品:以视频生成为主,用户可以输入文字和图片,从而得到AI生成的视频。已在短视频、广告、影视、短剧、漫剧、电商、物理AI数据增强等场景商业化落地。
2)实验室Demo级别产品:以交互式视频生成为主,用户可以操作动作,改变视频的状态。未来有望在游戏、设计、XR/AR等场景率先落地。
3)实验室预研方向:世界模型通过模拟行为对实际造成的后果,进而能够指导物理AI行动,从而实现物理AI规模化落地。




▍风险因素:
宏观经济恢复进度不及预期;相关产业政策不达预期的风险;企业核心技术、产品研发进展不及预期;AI应用落地速度不及预期;云厂商资本支出不及预期等风险;政府与企业IT支出不达预期的风险;AI竞争加剧等。
▍投资策略:
视频生成模型迭代加速,技术能力持续外溢赋能世界模型发展,行业迎来技术升级机遇。叠加海外融资密集催化,世界模型赛道有望依托模型迭代与估值抬升实现双重红利。
新浪声明:此消息系转载自新浪合作媒体,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。
责任编辑:凌辰
乐玩官网,头玩app官方正版下载,
乐玩游戏平台相关资讯:头玩官网,