观点网讯:5月25日,面壁智能宣布联合清华大学正式开源中国首个基于升腾训练的低比特端侧大模型BitCPM-CANN。

据介绍,该模型从量化算子、训练算法到全链路框架,均在华为升腾上原生完成。在推理阶段,BitCPM-CANN可释放约6倍显存红利,同时将模型能力保留率维持在90%至97.2%。

BitCPM-CANN包含0.5B、1B、3B、8B四个模型尺寸,与同尺寸MiniCPM4全精度家族逐项对照评测,性能表现优异。该模型采用量化感知训练技术路线,从训练初始阶段就让模型主动学习用1.58-bit的三值权重承载知识。

此前,BitCPM-CANN已在华为鲲鹏升腾开发者大会上完成首次技术亮相,今日正式将其全系列模型向全社会开放。

免责声明:本文内容与数据由观点根据公开信息整理,不构成投资建议,使用前请核实。

开云在线,mk体育中国官网,

开云体育官网相关资讯:mk官网,