作者|李香香

  编辑|叶映橙

  5月27日,小米旗下MiMo大模型团队公告称,对V2.5系列模型API进行永久性降价,最高降幅达99%,不再区分上下文窗口长度。同时优化Token Plan计费体系,同等价格下用量提升至原来的5-8倍。随后雷军转发此消息做出同等内容回应。

  小米技术官方微博表示,本次价格调整背后,离不开团队在推理系统上的持续优化。基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓存token数量提升至优化前的近5倍,显著提升了缓存命中率和推理效率。

  降价消息前一天晚间,小米集团发布一季度业绩:营收991亿元,经调整净利润61亿元;智能电动汽车及AI等创新业务收入199亿元,当季新车交付80856辆;研发投入90亿元,同比增长33.4%。雷军同时宣布,未来三年在AI领域投入600亿元,预计全年研发投入超400亿元。目前,MiMo-V2.5-Pro已在Artificial Analysis榜单综合智能指数、Agent指数上位列全球开源模型并列第一。

责任编辑:郭建

华体会体育下载,j9游戏,

hth体育相关资讯:http //j9.com/,