在本次2024世界机器人大会上,有一场十人对谈,堪称人形机器人「史上最大Penal」,其中干货量巨大,适宜业内外共同了解这一新行业的发展现状。
这十人包括:
主持:张建伟(中国工程院外籍院士,德国国家工程院院士,德国汉堡大学教授)
对话嘉宾:
甘中学(智昌科技集团股份有限公司董事长兼总经理,复旦大学教授)
任雷(月泉仿生公司联合创始人,吉林大学唐敖庆讲席教授)
许多(小米集团技术委副主席、手机部副总裁、机器人公司总经理)
程昊(加速进化科技有限公司董事长)
张世璞(Noetix Robotics联合创始人、首席执行官)
冷晓琨(乐聚(深圳)机器人有限公司董事长)
郭彦东(智平方创始人兼首席执行官)
李博阳(大连蒂艾斯科技发展股份有限公司联合创始人、总裁)
赵同阳(众擎机器人创始人兼首席执行官)
以下为RoboX提炼出的讨论内容,本期主题主要围绕中外差距、产学研问题,以及1-5年预测。
产学研融合需求
张建伟:要想获得不断的技术源泉,靠企业自身的研发肯定是远远不够的。我们应如何促进产学研更有效地合作,使得人形机器人这么复杂的系统能够源源不断的获得技术支撑?
甘中学:产学研合作很难,现在做大模型也好,未来做算力也好,有点跟随性的做法。大模型,还有算力、TPU等等,我觉得中国要想要在这方面走出自己的路来,一定要换一换研发思路。
建议一:要把大算力和算法的创新结合起来,必须是算力和算法并行进行,才能找到一个多快好省的办法,去和国外竞争。
建议二:具身智能目前正在开发当中,大语言模型我们已经不如国外先进,希望可通过具身智能的「知行合一」实现突破。
任雷:产学研融合是一个大趋势,因为人形机器人是高度复杂、集成的系统,它不光包括了感知、驱动、材料,结构,还是综合的多学科交叉的攻关项目。
目前,很多基本的科学问题还有待解决。首先我认为学校可以主要负责类似创新结构设计的工作,尤其是仿生的设计。另外新型的感知材料、驱动材料等,也应考虑在人形机器人上应用。
另外,学校也非常需要企业。因为学校有时更偏重于发论文,出专利。但是有可能这些技术只考虑性能,不考虑成本和工艺问题,这就脱离了批量生产的需求。
还有一件很重要的事:企业不能光去整一些炫酷的Demo,而是应该真正了解应用方的场景需求和任务需求,这是未来需要产学研融合去做的事情。
许多:针对一些尚未突破的科学问题,我们会和高校一同合作,进行科学范式的探索。而有些从其他行业迁移过来的成熟技术,则会由我们去做产业化。
在整体构型上,我们既要基于科学和高校、研究机构合作,也要基于应用去做产业的深度开发,最后把这两者在一个软件平台上、仿真平台上深度的融合,去加速应用。
我建议大家选择要做的东西时,还是要把这个产业坚决地做透。例如目前,一体化电机的MCU还是用英飞凌的,价格还是很高的,国产化也不充分。再比如,电机里面的编码器,国产做得也还是有非常大的差距。
人形机器人的市场规模是会比机械臂市场扩大到若干倍,过去那些做零部件的企业需要去重新思考,如何在更大的体量中做到更好。
程昊:现在这个阶段,有点像70年代信息革命刚开始的时候,硅谷作为发源地,其特点就是有斯坦福、伯克利,再加上政策推动,孵化出了很多企业。
创新是失败率很高的事情,100个创业团队可能最后只能活一到两个。但如果这些创新放在学校里,学生、老师用经费去做,试错压力会小一点。
在高校创新,然后在公司里去做商业化,再把赚来的钱回来反哺学校,就能形成一个非常好的循环。
张世璞:近两年,我们发现了非常多炫酷的Demo,其实背后都是在读博一、博二非常优秀的00后年轻人去做出来的。
现在技术发展迭代的速度非常快,甚至是按月来计。我们作为企业能够让这些优秀的年轻人拿到基础设施以后,快速验证自己的想法,让POC得到快速迭代。
冷晓琨:产学研结合是乐聚一直都在做的事情。2016年,我们10个哈工大师兄弟成立乐聚的时候,都在读书。我那时是博一,剩下的都是研一或本科生。
人形机器人是一个集成度特别高的产品,一个高校、一个实验室很难聚集这么多的技术来做这件事情,但是企业适合做这种大工程性的工作,并且进行产业化落地。
郭彦东:有一本书是《科学无境的前沿》,虽然是70多年前的思考,但也很好地分析了如何用创新来驱动经济发展。
其实科研呈现非常典型的纺锥型,它对于结果不那么敏感,更适合进行更长期的、更高远利益的投入,我觉得这个是真正的源头。
不管人形机器人创业有多么的火爆,都不应把这个源头的重要性忽视掉,我们还是有非常多的硬核科学问题,等着教授们去解决。
李博阳:我觉得现在高校老师手里还有很多好东西没有被挖掘出来,有一些项目在初期,可能并不是专为人形机器人做的,但那些技术可以去跟人形机器人做结合。
所以我觉得可以在体制的设计上更加开放,使高校的科研成果让更多企业接触得到,这样当我们打造机器人的硬件也好,应用场景也好,都可以到学校中去选择觉得适用的,然后经过进一步的转化应用产品中来。
另外还有人才方面的问题,有一些非常优秀的博士、硕士到了人形机器人企业中来,他很难马上上手,也不能马上融入到交叉学科的环境中来。所以我觉他们在校期间,除了老师带领做项目之外,企业也可以提供更多的前沿项目。
赵同阳:我们2016年创业到2018年期间,碰到了很多关于算法的问题,第一个想到的就是学校。2018年到2019年年初的时候,我们的本体做出来了,但是在国内力控算法都还没有。当时有一个契机是MIT开源,也是学校的力量,但是开源之后,国内真正能玩起来的没有几个人。
当初为了把这套算法引入国内,我找到了山东大学控制学院的李老师,他们的学生还是比较厉害的。他们告诉我,可以把算法搞定,但是结合本体硬件可能需要6个月的时间,后者恰恰是我们企业的能力范畴。
我记得用了不到6周的时候,我就把本体给做出来了,结合他们的软件沉淀和积累,把MIT的那套算法在国内复现,并且把它分享出来,成为一个开源项目。所以国内现在很多做力控算法的,在这方面都得益于那套算法。
另外在合作过程中,我也发现一些问题,铁打的学校,流水的学生,一代一代的沉淀和积累,系统性并不强,这会造成人才断链的问题。当我在今年重新做人形的时候,我发现这样的人才仍然是非常稀缺的,第一个想法仍然是求助于高校。
高校在算法上一直处于行业前沿,但他们落地有非常大的难度,尤其很多高校在仿真环境中做得非常棒,但一落到实物上都一塌糊涂。因此它需要和企业联合起来去解决Sim2Real,甚至技术到工程落地的gap问题。
另外,关于企业和高校他们之间利益的问题:很多高校需要发表paper,我们可以协助他们来做。企业需要有些知识产权还有商业上的成功,两方面可以互利互惠。
最后一点是关于教育体系:我发现很多课程的内容还是比较传统、比较老的知识,对企业现在所需要的先进算法还有差距。因此希望高校可以随时更新课程,这样能保证企业和高校时刻处于行业前沿。
短期趋势预测
张建伟:在伦理约束下,你们现在的best seller是什么,你们对未来1-5或者2B、2C的预测是什么?
甘中学:我们除了要研究通用人工智能的智能水平,同时还应该研究机器人智能向善的问题。这个问题不解决,时间长了就会造成祸害。
至于预测,中国现在这么大的人群群体来做人形机器人,我们产业化的速度肯定比任何其他国家都高。
比如说现在第一年像宇树科技等等已经开始进行量产,当然范围可能是在科研领域,或者展览馆。但是逐渐三年会到服务行业,五年可能到工业,我认为完全有可能。
任雷:我不做时间预测,先谈一下可能落地的先后顺序——人形机器人如果落地,很可能会是在产线的某些特殊岗位,或者特种机器人,比如巡检、维修这块。因为其场景相对简单,是一种结构化场景,识别起来相对简单。
我反倒觉得家庭家务、养老护理有可能是最后落地的。因为家里环境看着可能简单,实际上是高度非结构化场景,而且还在动态变化。
另外,这其中还包括了伦理问题:先不谈复杂伦理,单说之前提到的人机物理接触安全性问题,比如机器人要是摔倒的话,有可能把孩子砸着,这种情况如果一旦发生,这个由谁负责?
许多:人形可能还需要很长很长时间,我认为这要看接触精度。它包含移动精度、定位精度、抓取精度、放置精度、语义精度、反馈精度等等一系列精度,要看综合场景对所有精度的需要。
在工业简单场景包括物流场景里,人形机器人可能会优先落地,其他的可能还是要花很长时间。因为它和环境的连续性接触精度问题怎么解决,这还是一个科学问题,需要很长时间研究。
冷晓琨:对于人形机器人,乐聚这边基本原则是三步走,沿途下蛋。今年一百多台主要核心还是定位在高校、科研和展厅行业。
同时,这半年时间中,我们一家不落地走访了国内所有车厂,并且选择两家签了协议开始落地。它来解决的就是工业生产的最后一公里,非高精度的场景。并且双方联合高校已经开始做了,预计明年上半年已经可以算得过来ROI,进入投产了。
如果一个场景中人形机器人包括轮臂机器人,合起来能过500台产量的话,基本上代表人形机器人可以用到工业场景中来了,我认为这就是明年我们使劲的地方。
未来三年核心肯定还是工业为主,进入家庭、进入康养这部分,现在和海尔、中国移动都在合作,但是我认为还需要3-5年甚至更久的时间段。
李博阳:最先落地的可能是一些工业场景和特种场景,但我认为最先落地的不一定是完全形态的人形机器人,可能是另外一种形态,比如刚才说到的轮式或者手部不是完全五指的状态,这种场景我觉得在短期内就可以有很多落地的应用了。而且我觉得这个账也能算得过来,它真的是可以提高效率或者完成一些实际工作的。
未来真正能够迎来机器人大爆发的阶段应该是2C端的应用,特别是服务场景或者是生活娱乐场景。
赵同阳:以目前的技术,3到5年内人形不可能大规模地进入工厂和进入家庭,这点应该在座各位都有相同感受。
接下来关于工业和家庭使用,路很长,先进去再改善,才能进行用户反馈,进行下一步的改进,我认为还需要3年的时间。
张建伟:今天的这场对话,是ChatGPT绝对做不出来的。我一直说人形机器人对人类来讲是「最后一个梦」——把我们自己复制出来,然后理解我们的认知、行为、交互。
另一方面,它也有巨大的应用场景,目标设的非常高,只有协同合作、长期支持才能把这个赛道可持续的做下去,风景无限。