最近,硅谷机器人公司 Figure AI 的一场分拣直播,把人形机器人重新推到科技圈聚光灯下。

直播画面里,一台人形机器人站在传送带前,像仓库工人一样完成包裹分拣:识别包裹条码、抓取、翻转、调整方向,再放到对应位置。相比此前人形机器人跳舞、端咖啡、搬箱子,这一次 Figure AI 选择了一个更接近真实商业化的任务——物流分拣。

据外媒报道,Figure AI展示的是其F.03人形机器人,背后系统为 Helix-02。Figure AI CEO Brett Adcock对外表示,机器人在直播中实现自主运行,没有人类遥操作参与。直播画面显示,机器人能够连续数小时执行分拣任务,并接近约 3 秒处理一件包裹的人类工作节奏。这场直播迅速获得大量观看,也引发外界对人形机器人商业化进度的讨论。

Figure AI 之所以引发关注,并不只是因为机器人的分拣能力,而是因为分拣这个任务本身代表着具身智能进入现实产业的一道门槛。

在仓储、物流、制造业等场景中,大量工作都可以被拆解为识别、抓取、搬运、放置、复核等动作。过去,工业机器人更擅长在固定位置、固定轨迹、固定工件上完成重复动作;而具身智能机器人要解决的是更复杂的问题:物体形状不固定,位置不固定,任务指令可能变化,机器人不仅要动起来,还要理解环境、判断目标、规划动作,并在真实物理世界里稳定执行。

类似的公司,并不只在美国出现。在中国,科大讯飞体系内也有一家正在做类似方向的机器人公司——聆动通用。

聆动通用成立于2024年12月,总部位于合肥,是科大讯飞生态内聚焦工业具身智能的硬科技企业。公开资料显示,聆动通用定位为“讯飞系”具身智能通用机器人公司,聚焦具身大模型和通用机器人研发,主攻B端产业场景。

从应用场景看,Figure Al 此次展示的包裹分拣,与聆动通用切入的拣选、面单识别、工业操作等方向存在明显交集。两者都瞄准了具身智能商业化最现实的一类场景:让机器人在真实产业现场替代或辅助人类完成重复性、高频次、标准化程度较高的体力劳动。

据公开报道,聆动通用成立后已完成多轮融资。2025 年 8 月,公司完成数亿元人民币天使轮融资,讯飞创投持续战略加码,元禾璞华、优势资本、盈科投资、天智投资、合肥高投等参与投资。2026 年 4 月,聆动通用又宣布完成数亿元 Pre-A 轮融资,投资方包括华义创投、讯飞创投、泰达科投、博众精工产投等。

团队方面,聆动通用创始人兼 CEO 季超为中国科学技术大学博士,长期从事机器人感知、交互、运动控制和具身智能相关技术研发。公开资料显示,季超毕业后加入科大讯飞,参与过 AI 智能硬件、机器人和具身智能关键技术研发及产业化工作。

在技术路线上,聆动通用提出的是“大脑—小脑—本体”全链路自主可控架构。其中,“大脑”对应机器人的认知、理解和任务规划能力;“小脑”对应运动控制、技能执行和动作稳定性;“本体”则是机器人完成物理交互的硬件基础。

聆动通用公开介绍中提到,公司聚焦打造高泛化性的具身大模型和通用鲁棒机器人本体,推出了 iFlyBot-VLM 视觉语言基座大模型和 iFlyBot-VLA 视觉-语言-动作操作大模型,试图解决具身智能在真实场景中的泛化和落地问题。

(视频1 机器人执行1小时长程任务操作)

(视频2 VLA推理翻面单技能)

(视频3 一台机器人可串接多任务作业)(视频3 一台机器人可串接多任务作业)

中国拥有庞大的制造业、仓储物流、商超零售和工业自动化需求。相比家庭服务机器人,B 端产业场景需求更明确,付费能力更强,ROI 也更容易计算。分拣、拣选、搬运、上下料、质检、补货等任务,都可能成为具身智能机器人的早期落地场景。从技术演进路径来看,科大讯飞的 AI 能力布局呈现清晰的递进逻辑:从核心的大语言模型起步,先完成文本理解、知识推理与自然交互的基础能力构建;再升级为多模态大模型,打通视觉、听觉、语言等多维度信息感知与融合,让 AI 具备 “看懂、听懂、理解” 复杂场景的能力;最终延伸至具身智能模型,把虚拟世界的 AI 认知能力,落地为物理世界的感知、决策与动作执行能力。

而聆动通用,正是科大讯飞将这套完整 AI 技术体系,从数字世界走向实体产业、从软件智能走向软硬件一体的关键载体,也是中国具身智能追赶全球前沿、实现产业落地的重要力量。

米兰app体育下载,mk体育登录入口,

米兰体育下载相关资讯:mk sports,