来源:柒财经

  随着算力成为数字时代的“水电煤”,如今在金融行业,高性能计算已从后台的成本中心,快速跃升为前台竞争的核心引擎,更被银行、保险、券商等机构视为关乎生存的“必答题”。

  当下,英伟达限售、国产卡产能吃紧、智算中心建设周期漫长……一家中小银行的CTO焦虑的可能是“抢不到GPU算力”——大模型风控、智能客服、实时反诈,哪一样都离不开AI芯片。

  而在三十年前,他的前辈担忧的则是另一件事:大型机别宕机。

  那时候,IT部门最怕的是“批处理”跑到一半主机崩溃,全行网点等着轧账,柜台前排队的人群能堵到马路上。

  从“别宕机”到“缺算力”,金融行业对计算的渴望,四十年间到底发生了什么?

  01

  集中式计算时代:算力是“奢侈品”

  上世纪八九十年代,算力之于金融行业,是真正的“奢侈品”。

  一台IBM大型机动辄上千万美元,只有财大气粗的国有大行买得起。操作手册写满几十页,机房要恒温恒湿,运维人员穿白大褂,守护算力设备像守护核反应堆一样严肃、庄重。

  彼时的金融业务也很简单:存款、取款、转账,每天日终做一次“批处理”,所有网点停止营业等轧账。算力只服务于核心账务系统,目标是“不出错”。

  变化始于90年代末。ATM机大规模铺开,柜面终端从“哑终端”变成智能PC,算力开始从总行下放到网点。

  2002年,银联成立,标志着跨行交易成为现实,算力第一次需要联网工作。

  后续几年,国有大行和区域银行,先后启动上收数据工作,算力从分散又重新走向集中。

  2005年9月25日,中国建设银行历时三年的数据集中工程(DCC)正式上线,以吉林省分行柜面系统成功上挂总行数据中心为标志,实现全行38家一级分行及总行营业部的业务与数据集中。同年,农业银行跟进推动数据上收,目标是形成“一个法人、一个版本、一个网络、一个中心”的系统优势。

  这场算力变革,不是把服务器简单堆在一起,而是逻辑上的统一调度。用时任建设银行行长常振明的话说,核心是“总行对实时交易风险的监控能力”。

  与此同时,为给数据集中奠基厚土,以工商银行启动跨世纪的“9991工程”,在上海外高桥和北京西三旗征地建设两大超大规模数据中心为标志,并被其他国有大行和股份行效仿,拉开了中国银行业自建数据中心的序幕。

  但银监会敏锐地意识到,数据集中之后,信息资产的风险管理将成为新课题。2005年初,《银行业信息资产风险监管暂行办法》进入第八轮修改,监管层开始用“管法人、管风险”的思路,审视这场算力革命。

  02

  云计算时代:算力从“自建”到“租赁”

  进入21世纪的第二个十年,事情又起了变化。

  手机银行、移动支付、线上信贷、实时风控……金融业务场景的井喷,对算力的需求不再是“平稳的批处理”,而是“波动的实时计算”。双十一的峰值流量,是平时的几十倍;只要季末冲刺营销活动,IT部门就要临时加服务器。

  央行报告显示,2013年—2016年,我国移动支付笔数从16.74亿笔狂飙到257.1亿笔,三年增长15倍,也基本完成了从“小众尝鲜”到“全民标配”的跨越。

  到2017年底,工信部总工程师张峰在国新办发布会上宣布:我国移动支付交易规模近150万亿元,居全球首位。

  汹涌而至的移动支付浪潮,在一定程度上冲击了金融机构以往依赖的自建数据中心模式。

  更大的掣肘则来自成本。服务器要买、机房要建、电费要交,但算力利用率较低。

  据浪潮人工智能研究院测算,我国智算中心平均算力使用率仅为30%。邮储银行总工程师徐朝辉曾在行业会议上坦言,“高峰期算力集群利用率达60%已属优秀”。

  “养不起、用不好”,成了金融机构的新烦恼。解决方案是上云。

  银监会在2016出台了《中国银行业信息科技“十三五”发展规划监管指导意见》,云计算是重点提及的内容之一,表示“探索构建私有云平台,形成资源弹性供给、灵活调度和动态计量的私有云平台”“联合开展面向银行业的公共云平台规划和建设,形成公共基础设施、公共接口、公共应用等一批技术公共服务。”

  政策驱动+现实瓶颈,从私有云到行业云,再到混合云,金融机构开始尝试“算力即服务”模式,即不自己养算力,而是按需租用。

  宇信科技是这轮变革的典型代表。其依托自建的“宇信金融云”,推出了智算租赁+场景服务解决方案,专门针对银行在智算领域的GPU资源短缺、算力协同困难、利用率偏低等痛点。

  相关行业报告显示,到2025年,金融机构办公系统上云率达85%,外围业务系统上云率达90%。

  但不同类型银行的上云率存在差异,具体为股份行最高,中位数95.73%;国有大行与民营银行次之,上云率中位数超过85%。

  03

  AI大模型时代:算力成为“稀缺资产”

  2022年底,ChatGPT引爆全球大模型热潮。金融行业很快意识到:新的革命,来了。

  数字客服、实时风控、个性化推荐、智能投顾……大模型几乎可以重构每一个金融场景。

  2025年12月26日,国家金融监督管理总局发布《银行业保险业数字金融高质量发展实施方案》,共提出33项工作任务,涵盖数字金融治理、数字金融服务、数字技术应用、数据要素开发、风险管理等六大领域,支持有条件的金融机构构建企业级人工智能平台。

  2026年3月11日,央行召开2026年科技工作会议,明确提出“深化业技融合,积极稳妥、安全有序推进金融领域人工智能应用,释放数字化、智能化发展动能。”

  这一表态确立了央行对金融AI应用的总体基调:“积极稳妥”意味着鼓励探索,“安全有序”则划定了合规底线。

  但对金融机构来说,部署大模型等人工智能技术,前提是要有足够的算力来训练和推理。

  但摆在面前的难题是,训练一个金融大模型,需要数千张GPU卡,单次成本千万级。而英伟达高端芯片被限售,国产卡产能又跟不上。

  金融业第一次尝到了“缺芯”的焦虑。

  某股份行IT负责人私下感叹:“以前我们担心的是系统稳不稳定,现在我们担心的是想买卡买不到,想租卡没资源。”

  此外,实时风控、智能网点等场景又要求低延迟、数据不出域……不能什么都往云端传。

  怎么办?答案是算力下沉,并逐步演化出两条路径。

  一条路径是国产算力底座。以东华软件为例,其与华为昇腾/鲲鹏生态深度绑定,2025年中标算力相关项目近40亿元,在北京、武汉、沈阳等地落地多个智算/超算中心,直接嵌入了金融机构的骨血里。 

  2025年底,东华软件中标华夏银行交易型数据库项目。更早之前,它的反洗钱产品已服务40余家银行。

  另一条路径是端侧算力,让ATM、网点柜面、POS机等金融终端,自带AI能力,数据在本地处理,不依赖云端。

  恒银科技正是这个方向的”排头兵“。

  2025年底,恒银科技与国产GPU厂商沐曦股份签署战略合作,共同开发面向金融、政务等场景的AI服务器和训推一体机。

  这意味着,未来的银行网点,每一台设备都可能是一个“智能节点”:客户刷脸的瞬间,活体检测和身份核验在本地完成,无需等待云端响应。

  浪潮信息则从基础设施层面推动变革。该公司提出,金融领域已经从以CPU为中心,进入“一云多芯、一机多芯”的新阶段——ARM、C86、GPU等多种算力芯片混部,通过统一的云操作系统进行调度。

  这种“云+边+端”协同的算力架构,逐渐成为新一代金融基础设施的标准形态。

  但不容忽视的是,算力下沉带来的不只是效率革命,还有新的合规挑战。

  最棘手的是算法“黑箱”。大模型的决策过程难以追溯和审计,当AI系统做出错误授信或误判风险时,责任该由谁承担?金融机构、模型服务商还是数据供应商?责任若不能穿透,AI就可能成为规避监管的工具。

  数据隐私是另一道红线。AI训练需要海量金融数据,但客户信息的使用边界尚未完全厘清。最新出台的《金融法(草案)》明确要求:数据收集必须履行充分告知义务,杜绝超范围收集个人金融信息。

  以及金融信息污染风险。生成式AI可以高速、高频输出财经评论、投资观点,与一般谣言不同,AI信息污染更“专业”——不直接编造事实,而是通过片面选择材料、错误归因,制造貌似合理但实际误导的市场叙事。

  监管已开始行动。2026年5月,国家网信办等三部门联合印发《智能体规范应用与创新发展实施意见》,首次要求厘清“仅限用户决策”“用户授权决策”“智能体自主决策”三类权限边界,确保用户享有知情权和最终决策权。

  从“可用”到“可控”,这恐怕是金融AI化进程中,最难啃的骨头。

  04

  结语

  从大型机到GPU集群,从“能跑批处理就行”到“毫秒级响应是底线”,金融行业对算力的追逐从未停歇。

  每一次算力跃迁,都伴随着金融业态的重构和效率的大幅提升。集中式计算时代,我们有了全国统一的支付清算系统;云计算时代,移动支付和线上信贷成为可能;AI大模型时代,我们持续见证智能投顾、实时风控、个性化服务的全面落地。

  今天,当银行CTO为“缺芯”焦虑时,真正的考验或许是:有了更强的算力,我们能做出怎样不一样的金融服务?

  这个问题的答案,不在GPU里,而在对金融本质的理解中。算力越强,越要回归业务本身:服务实体经济、防范金融风险、满足人民群众日益增长的金融需求。

  这才是算力进化的终点,也是金融科技不变的初心。

责任编辑:秦艺

头号玩家游戏,米兰app下载,

头号玩家游戏相关资讯:米兰体育,