专题:第28届北京科博会-未来产业推介会


  第28届北京科博会-未来产业推介会于2026年5月8日-9日在北京举行。千寻智能董事兼副总裁孙荣毅出席并演讲。
  以下为演讲实录:
  孙荣毅:各位专家、各位同事,大家上午好,下面由我代表千寻智能分享我们在具身智能领域的创新成果。千寻智能在机器人硬件和模型领域有全栈的研发能力,我们自身还是定位一家具身智能模型公司,现在也是国内唯一的同时被小米、宁德、京东同时投资的具身智能企业。
  千寻智能刚刚成立2年,现在是行业里面最年轻的独角兽企业,这里大家可以看到两张图,是我们验证具身智能数据Scaling Law曲线,我们发现预训练数据每提高一个数量级,后训练的finetune对数据量需求降低大约一半。现在我们已经积累了100万小时预训练的数据,在100万小时预训练的基础下,我们对简单任务可以实现数十条数据的采集,就可以实现99%的成功率,基本上可以达到即插即用的效果。针对复杂的任务,在100万小时预训练之后,我们只需要采不到30个小时的数据就能够达到70%的成功率。同时我们这边的合作伙伴除了刚才提到的小米、华为、宁德、京东以外还有西门子和博士。
  在今年初我们也是国内首个在权威榜单上超过了Pi 0.5具身智能模型的企业,我们也将Spirit V1.5的模型进行了开源,大家后续可以从网站上下载。我们这边VLA的核心构架是通过预训练提高泛化能力,通过遥操作模仿学习提高精准度,最后通过强化学习提高鲁棒性,同时通过思维链以及智能体等任务对VLA、VLN模型进行任务的调度。
  我们的财务投资人、战略投资人和国资投资人都是一线明星机构,千寻的创新成果得到了行业投资者的充分认可。
  下面向大家分享一下我们在数据、模型和智能体方面取得的成绩。首先在数据方面,除了条数、小时这两个维度之外,我们还用Token数据来衡量数据量,现在我们已经积累了10T Token的高质量数据,数据有效性达到了95%。在模型方面我们是采用端到端的模型在工业现场进行落地,现在我们的成功率能够达到99.5%,具身智能模型端到端的落地就像自动驾驶有个长尾效应,我们会通过远程运维接管的形式达到综合成功率100%的效果。最后是长程任务开发方面,我们是开发了自己的智能体,能够针对复杂的各种各样环境调度我们的VLA模型。
  这个是我们的数据,现在我们的预训练部分主要是互联网视频和Ego centric,以及便携式的数采装备,合计约10Ttoken,这个主要是做预训练,提高模型的泛化能力。在后训练finetune部分,是0.4T个token,他们之间差了一个数量级。最后通过在线强化学习进一步提高成功率,只有0.02个Token。现在我们和大语言模型对比,大语言模型是20T到30T的Token,具身智能我们已经收集到了10T,逐渐逼近大语言模型,这个也让我们看到未来的曙光。
  收集到海量的数据是第一步,另外非常重要的是如何对这些数据进行质检、清洗、标注、对齐等等一系列操作,采数仅仅是第一步,后面如何去处理?现在行业里面有很多公司但是都是采用传统的劳动力密集的形式堆人,水多了加面,面多了加水,这里面我们也开发了AI自动化的数据处理的核心算法,一共13项。像在开放域类方面,像视频语义描述,人体姿态估计等等我们都取得了很多的成绩。现在我们的infra数据处理的平台,已经能够达到100万小时/年的处理能力。
  大家都在想如何便携式的去获取高质量、低成本、多样化的真实数据,这个是整个行业里面大家所追求的,我们这边在数据的便携式采集装备方面一直在不停地研究,现在已经迭代了六七代,这里给大家分享一下数据飞轮。
  千寻智能还是以真实数据为主,左边是我们的飞轮,右边是数采员在现场简单录的视频,这还不是我们最新的设备,是我们两代之前的,在真实的环境里面,带着数采装备一边干活,这是在做饭。关于数据飞轮,训练一个模型就是数据飞轮在闭环旋转,从最开始设计一个动作,到采集数据,再到数据处理,模型训练,评估真机运行,转一圈是一个完整的闭环,训练一个任务基本上要转2圈到3圈。去年的时候全国各地建了很多数据训练厂,政府牵头来建的,但是客观来讲运行得并不好,技术不闭环,商业模式不闭环,首先数据不闭环就在于数据飞轮没有转起来,只是不停采数,没有对数据做处理,没有训练,也没有去推理,导致采的数都是低效、重复的数据,采得再多也没用。技术不闭环之后就导致采来的数没人要,你再便宜大家也不不会买,因为没有价值。
  我们在真实数据里面采集的场景,这个是我们现在的统计,大多数都是围绕着家庭来展开的,围绕着柔性物体来统计的,在2026年我们计划要采集100万小时的真实数据,未来的数据工厂一定会突破围墙的限制,不再拘泥在一个固定的环境下面,搭一些影棚式的场景来回采数据,那个东西只是做DEMO用的,真正走进家庭,走进真实环境下面,一定是来自于真实场景多样化的真实数据,尤其是涉及到流体、力,还有柔性物体,仿真是很难仿出来的。基于此我们推出了便携式数采装备,通过众包的形式分布下去,让大家穿着这个,一边干活,一边采数,不会额外增加成本。
  在模型训练方面,我们是采用三段式,首先是预训练,就是提高模型的泛化能力,让模型了解物理世界的先验知识,其次通过后训练,提高操作的精准度,最后通过机器人在实际作业中遇到的bad case 和coner case进行微调,提高最终的鲁棒性。
  现在工业领域的成功率是99.5%,有的时候大家也会提到,在工业领域里面能不能达到100%?传统的预编程自动化是可以的,但是现在端到端就像自动驾驶一样,是有一个过程,有一个长尾效应。
  除了VLA模型之外,在不同的场景里面,复杂的环境、复杂的任务,除了考察模型之外还有很重要的一点是Agent智能体,在这里我给大家展示机器人进行书桌收纳整理的任务,有四个子任务,第一件事要把抽屉打开,把两个订书器放进去,大家可以看到它拉抽屉过程中,因为物理世界有摩擦力和阻力,一次没有拉成功,后来又进行重新尝试,又重新拉了两次,把它拉到了一个它认为合适的位置,把第一个订书器放进去了,抓取第二个订书器,抓取过程中第一下没有抓到,它再去抓第二下,扒拉过来之后抓到放进去,放进去之后把抽屉合上,这个是书桌收纳的第一个小任务,就把订书器放抽屉里。
  第二件事要做什么呢?要把笔放到笔筒里面进行收纳,第一下拿到这个马克笔,拿的过程中被旁边的盘子碰掉了,碰掉之后就放弃了,拿起一个好拿的笔放进去,后续它去干别的活,当它的任务被打断之后能够重新规划任务,并且设置优先级,先去做好做的,比如说把水果放到盘子里面了,又把一个饮料放到书架上,把饮料放到书架上之后,把它之前被打断的任务,它认为最难的这个再去做,把这个马克笔重新放到笔筒里面,这就是在未来的家庭场景里面环境会很复杂,在做任务过程中会不断有环境的变化,扰动以及干扰,这个时候就需要智能体对长程的复杂任务进行规划、进行处理。
  经过2年多的发展,我们也在不断的探索具身智能的范式到底在哪里?除了大模型以外,还有本体。还有一个很重要就是可拓展的平台Infra,如果我们把模型和机器人比作一辆汽车在快速奔跑的话,Infra平台体系就如同高速公路,只有把高速公路修得平整,车才能跑得更快。
  这个是我们千寻智能成立两年模型能力的提升情况,从最开始2024年的7月份V0版本只能完成单一的基础任务,只能完成做咖啡,到2024年底的时候我们已经可以实现多任务了,就像叠杯子,抓取精小的物体。再到去年的时候我们在展会上面就可以打开玻璃门去取各种饮料,包括完成复杂的柔性物体,再到今年我们已经实现了移动的多任务的操作包括和人语义处理等等,开发了我们的智能体。
  去年世界机器人大会上,我们用机器人来串糖葫芦的,当时时间比较紧张,我们是遥操作来串糖葫芦的,动作的柔顺性、流畅性、稳定性、精度非常棒,可以完成串完糖葫芦的任务,还和顾客进行调皮的互动。右边是在今年3月份的中关村论坛上面,当时北京市科委的领导来找到我们,大概还有不到一个月时间,希望用模型来完成串糖葫芦的任务,我们用了两周多的时间,这个任务是由数据工厂数采员的小姑娘完成的训练,它其实没有代码的能力,之所以能够在2周左右的时间能够完成穿糖葫芦任务的训练,主要得益于Infra,整体数据采集的飞轮,后面有一个非常强大的Infra的系统,能够让我们的时非常简易采集数据,做质检、做标注、做模型的微调,再去迭代,最后还是比较成功的完成了北京市交给的任务。
  这是我们的本体展示,除了遥操作,我们也是国内唯一全身力控关节都是柔性力控的,可以和物理世界很柔性的交互,同时我们也解决了很多世界级的数学算法难题,机器人可以像滑雪一样S型前进,可以实现零空间的运动。
  在商业化部分,这边我们的机器人在宁德时代,是在量产线上工作,解决生产制造过程中多品种、小品量、高柔性的生产组织模式,用具身智能的泛化能力解决生产过程中环境的变化,工件的泛化和工艺的泛化。宁德时代电池的种类非常多,有上千种,频繁的切拉换型是它生产过程中一个很大的痛点,我们针对具身智能的模型泛化能力,解决智能制造模式里面由三级向四级的跃升,就是解决多品种、小批量、高柔性。如果只是单一品种大批量、重复性的工作来说完全没有必要用具身,传统的预编程,或者是复合机器人能够实现,所以具身智能一定要发挥模型泛化能力,解决场景里面的痛点。
  这个是我们和京东的合作,我们在京东的京东MALL家居生活馆里面,大家有机会可以去京东,我觉得京东的购物体验还是非常好的,按照京东产品的排名分类,会把爆品推到前面,我们机器人是在京东这里面排名第一的咖啡机,给顾客做咖啡的展示。
  我们宏伟的计划是要在未来十年,在具身智能这个赛道上面,在国际舞台上面我们已经由并跑实现领跑身位的跃迁,我们很荣幸能够见证中国未来的历史时刻,以上就是我们的分享,谢谢大家!
  新浪声明:所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

责任编辑:梁斌 SF055

易游体育网址,mk体育在线,

易游官网相关资讯:mk体育官网首页,