【TechWeb】5月25日消息,面壁智能宣布联合清华大学、OpenBMB开源社区,正式发布并开源其在低比特大模型训练方向的最新成果——BitCPM-CANN。
这款中国首个完全基于国产算力平台华为昇腾实现端到端训练并开源的三值(1.58-bit)大模型,继5月23日在华为鲲鹏昇腾开发者大会(KADC 2026)完成首次技术亮相后,今日正式将其全系列模型向全社会开放。
据介绍,相比传统 BF16 精度,BitCPM-CANN 在推理阶段释放约6倍显存红利,同时将模型能力保留率维持在90%–97.2%。同样的设备内存,可以承载远超以往的模型能力;或者反过来说,同样的模型能力在同一款终端上运行,只需要过去 1/6 的内存。这意味着,未来有望在手机上运行 60B 大模型,手机的智能会大幅提升。
「2-bit」是近一年来端侧芯片行业的热门研究话题,也是在手机上运行更大参数模型的最大技术卡点之一。2-bit 量化将模型权重压缩 6-8 倍,使其能存入手机闪存,如 4GB 内存能放 16B,再配合 MoE 与激活范围约束、能放 32B;若内存扩大到 8GB,则能将模型参数扩大到 60B。
面壁智能表示,BitCPM-CANN 的亮相,标志着面壁智能高效大模型「小钢炮」在端侧落地的能力进一步跃升,同时也通过开源向中国端侧大模型赛道提交了一份新的答卷。
吉祥体育网址,头号玩家网站,
吉祥体育原生下载相关资讯:头号玩家正版官网入口,