
文|晓锋
来源|博望财经
厮杀、内卷、竞争.....这些词语几年前没人想到会被用于国产大模型身上。
但在今天,该来了都来了。
2026年5月的中国AI圈,没有任何一件事能比两笔融资更让人血脉偾张。
近几日,市场传出DeepSeek正在推进500亿元人民币的首轮融资,投后估值直指3500亿元 。在此之前,月之暗面传出或拿到20亿美元(约140亿人民币)的一大笔钱,估值突破200亿美元,约1400亿人民币。
这自然已经不能简单的资本游戏来比喻了,中国大模型未来格局的生死之战开始到了。
从2023年的“百模大战“到今天的“双雄对决“,行业只用了三年时间就走完了互联网十年的路。时下市场正在见证一个残酷的事实:大模型的竞争开始告别过去技术的单打独斗,成了一场关于耐心、资本和商业化的三重马拉松。
一旦技术差距逐渐缩小,当用户增长遇到瓶颈,最终能活下来的,一定是那些能把技术转化为真金白银的公司。
月暗与DeepSeek之争,技术秀场走向了资本肉搏
月之暗面与DeepSeek属于友商,也属于竞争者。
竞争往往具有残酷的一面,这是一场典型的互联网式逆袭与反逆袭。故事的上半场,DeepSeek在去年春节期间黑马之姿横空出世,用极致的性价比和硬核的技术能力,硬生生从巨头的夹缝中杀出一条血路;故事的下半场,曾经有些承压月之暗面,凭借着密集的融资和精准的产品定位,上演了一场漂亮的绝地反击。
此前DeepSeek最新发布的DeepSeek-V4-Pro模型API开启2.5折价格特惠,输入(缓存命中)价格为0.25元/百万Token,输入(缓存未命中)价格为3元/百万Token,输出价格为6元/百万Token,优惠期截至5月5日。

而据Open Router数据显示,最新推出的海外知名AI大模型GPT-5.5 Pro加权平均输入价格为30美元/百万Token,输出价格为180美元/百万Token,从输入价格就和DeepSeek V4 Pro相差超700倍。如此看来,以性价比和成本控制能力著称的DeepSeek,随时都掌握着优势牌。
需要指出的是,DeepSeek没有任何大厂的流量加持。它完全依靠口碑传播,在没有大规模投流的情况下,硬生生挤进了第一梯队。
业内能“技术驱动增长“的模式,足以让整个行业为之震撼。
而月之暗面,处于承压时刻。虽然Kimi凭借超长文本处理能力积累了一批忠实用户,但在DeepSeek的价格攻势和行业内卷下,用户增长与市场份额面临着新挑战。
不过资本对这家公司仍有不少期待。
天眼查数据显示,从1月到2月,月之暗面密集完成了三轮融资,金额分别为5亿美元、7亿美元和7亿美元,算上这一轮,月之暗面半年内累计融资超过39亿美元,总融资额突破376亿元人民币,成为国内大模型创业公司中累计融资最多的企业 。
手握这些现金的月之暗面,也在模型层面立刻发起了反击。4月20日,它发布并开源了Kimi K2.6模型——1T参数MoE架构,32B激活,可连续编码13小时,Agent可持续自主运行5天 。在多项全球权威基准测试中,K2.6的表现与GPT-5.4持平甚至反超,一举夺回了开源模型全球第一的位置。仅仅四天后,DeepSeek不甘示弱,发布了V4系列模型,与Kimi一起包揽了全球权威开源模型榜单的前两名。

这场技术与资本的双重较量,已经进入了白热化阶段,它们就像两个势均力敌的拳击手,在擂台上你来我往,每一拳都打在对方的要害上。
本质上这场竞赛已经超越了技术本身。它是两种商业模式的对决:DeepSeek走的是“开源+性价比价“的普惠路线,试图通过规模效应降低成本。
月之暗面在“长文本+企业服务“的差异化路线上颇有特色,试图通过高价值客户实现盈利。 这两条路线没有绝对的对错,只有谁能更快地跑通商业闭环。而现在,它们都站在了同一条起跑线上,等待着市场的最终裁决。
大模型的三个阶段耐心赛,参数竞赛变为盈利决战
如果我们把大模型的发展历程比作一场马拉松,那么它可以清晰地分为三个阶段。第一阶段是技术和参数的竞争,谁的模型更大、能力更强,谁就能吸引用户和资本;第二阶段是用户和流量的竞争,谁能获得更多的月活用户,谁就能占据市场主导地位;第三阶段是商业化和盈利能力的竞争,谁能赚到钱,谁才能活到最后。
国内行业现在正处于第二阶段向第三阶段过渡的关键时期。
第一阶段的战争,在2025年底就已经基本结束了。从2023年开始,各大厂商疯狂堆参数、砸算力,从百亿参数到千亿参数,再到万亿参数,参数规模的竞赛愈演愈烈。然而,随着MoE架构的普及和推理成本的下降,单纯的参数规模已经不再是核心竞争力。
不少产品的推理成本正以每半年接近10倍的速度下降,能力已经超过两年前最大的闭源模型 。
这意味着,技术门槛正在快速降低。当玩家的模型能力都差不多的时候,竞争的焦点自然就转移到了用户身上。于是,我们看到了2026年春节期间那场惨烈的“红包大战“。字节跳动、阿里巴巴、腾讯等巨头纷纷砸下数十亿资金,通过红包、会员等方式疯狂拉新。
QuestMobile数据显示,2026年一季度,AI原生App月活用户规模达到4.4亿,单季度新增了1.3亿用户。

用户争夺战,让行业格局发生了巨大变化。拥有流量优势的大厂迅速拉开了与创业公司的差距。豆包月活达到3亿多,占据了绝对的领先地位。
而通义千问依托淘宝、支付宝等生态,月活也十分领先。至于DeepSeek和月之暗面这两家创业公司,虽然没有大厂的流量加持,但凭借着出色的产品体验,依然守住了自己的阵地。

然而,用户增长的红利正在快速消退。几乎所有网民都用过至少一款AI产品之后,拉新成本会越来越高,留存会越来越难。这时候,第三阶段的战争——商业化决战,就不可避免地到来了。
回过头来看,事实上的商业化的号角已经吹响。
月之暗面的ARR(年度经常性收入)从2026年3月初的1亿美元,短短一个月就增长到了超过2亿美元。DeepSeek的API调用量占也在持续提升。科大讯飞更是在2025年实现了8.39亿元的归母净利润,成为几家头部大模型公司中鲜有盈利的企业 。
不难判断,大模型已经从“烧钱换增长“的阶段,进入了“赚钱求生存“的阶段。资本不再盲目追捧那些只有技术没有收入的公司,而是更加看重企业的盈利能力和现金流。那些不能在未来1-2年内实现盈利的公司,将会被市场无情地淘汰。
大模型的竞争,目前进入到耐心赛阶段。它考验的不是谁跑得更快,而是谁跑得更久。第一阶段拼的是技术实力,第二阶段拼的是运营能力,第三阶段拼的是商业智慧。只有顺利通过这三个阶段的考验,才能成为最终的赢家。而现在,我们正站在第二阶段和第三阶段的十字路口,每一个选择都将决定未来的命运。
既生瑜何生亮,大模型的终局会重演移动互联网吗?
“既生瑜,何生亮“,这是很多人看到月之暗面和DeepSeek激烈竞争时的第一反应。它们都是中国大模型创业公司的佼佼者,都拥有顶尖的技术团队和雄厚的资本支持,都在各自的领域做到了极致。然而,历史的经验告诉我们,在互联网行业,很少有两个势均力敌的对手能够长期共存。
移动互联网时代的故事,我们都耳熟能详。千团大战最后只剩下美团和饿了么,网约车大战最后只剩下滴滴和高德,短视频大战最后只剩下抖音和快手。每一个赛道,最终都会形成“一超多强“或者“双雄并立“的格局。那么,大模型行业会重演这样的历史吗?
答案是:会,但又不完全会。
说它会,是因为大模型行业同样具有极强的规模效应和网络效应。模型训练的成本是固定的,用户越多,分摊到每个用户身上的成本就越低;同时,用户越多,产生的数据就越多,模型就会变得越智能,从而吸引更多的用户。这种正反馈循环,会导致强者愈强,弱者愈弱。
“只有大厂能够烧超大模型“,大模型行业的集中度会非常高,最终能活下来的公司可能只有几家。
说它不完全会,是因为大模型行业的生态比移动互联网更加复杂。移动互联网时代,每个赛道的商业模式都比较单一,要么是广告,要么是电商,要么是佣金。而大模型行业,既有面向C端的聊天机器人,也有面向B端的API服务,还有面向特定行业的垂直解决方案。不同的商业模式,对应着不同的客户群体和竞争壁垒。
这意味着,即使是在头部公司之外,依然有很多细分市场的机会。比如,专注于医疗大模型的公司、专注于法律大模型的公司、专注于金融大模型的公司,都有可能在自己的领域里活得很好。它们不需要和DeepSeek、月之暗面正面竞争,只需要把自己的垂直领域做深做透,就能获得足够的生存空间。
不是大厂的最终命运会是什么样的呢?有三种可能:第一种是“双雄并立“,它们各自占据不同的市场份额,长期共存;第二种是“一家独大“,其中一家通过技术突破或者资本运作,彻底击败另一家;第三种是“被收购“,它们最终被字节、阿里、腾讯这样的大厂收购,成为巨头生态的一部分。
无论哪种结局,有一点是确定的:这场战争不会很快结束。大模型的商业化才刚刚开始,未来还有很长的路要走。对于月之暗面和DeepSeek来说,现在最重要的不是打败对方,而是尽快跑通自己的商业模式,实现自我造血。只有这样,才能在接下来的寒冬中生存下来。
历史总是惊人的相似,但从来不会简单地重复。移动互联网时代的终局,不会完全照搬到大模型时代。但有一条规律是永恒不变的:商业的本质是价值创造。
模型正在以前所未有的速度改变着我们的生活和工作方式。它就像20年前的互联网,10年前的移动互联网,正在创造着无数的机会和可能。但同时,它也充满了残酷和不确定性。
责任编辑:杨赐
球友会app下载,leyu,
qy球友会相关资讯:乐鱼leyu,