困于应用落地难题多时的人形机器人产业,终于等来了人工智能这个“及时雨”。
过去一年里,随着人工智能技术地迅速发展,大模型成为机器人的“最强大脑”,使其交互水平大大提高,更多应用场景开始成为可能。
近日,深耕人形机器人产业的大连蒂艾斯科技发展股份有限公司(以下简称EX机器人)创始人李博阳在接受《每日经济新闻》记者(以下简称NBD)专访时表示,近期人形机器人产业发展迅速,大模型技术的引入显著提升了机器人与用户的交互体验,同时随着核心零部件的自研,研发成本也有了显著下降。“更为关键的是,应用场景方面,EX机器人旗下的线下文旅综合体已实现盈利。”
不过李博阳也指出,从产业发展趋势来看,未来3年之内会有很多落地场景出现,但预计5年之内人形机器人仍将主要面向公共服务和工业应用领域,真正进入C端市场还需要10年左右的时间。此外,随着人形机器人企业数量和产品的增加,市场已经出现了同质化的情况,未来3至5年会是行业淘汰期。
EX机器人创始人李博阳 图片来源:每经记者 杨卉 摄
要做有感情、有“人设”的机器人
NBD:2024年EX机器人参加了很多展览,从应用场景及功能的角度看,和往年相比,机器人最大的区别是什么?
李博阳:今年展出的机器人更多突出了大模型的应用,有的机器人是完全按照现实生活原型做的孪生,比如一款初中生形象的产品,就是“真人形象+角色模型”的产物,它的“人设”就是一名初中生;我们的智能客服机器人背后也有一个大模型在支撑,可以实现和机器人的问答类交互。在更新周期上,产品技术是不断更新的,近期上新的两款机器人主要是面向的市场不太一样。
NBD:我们注意到,EX的人形机器人和市面常见的类型有些差别,更应该称为仿生机器人,面部表情高度类人,但不能实现双足行走。请问您最初为什么会选择这样一个细分领域?
李博阳:其实这个领域也不能完全算是细分或小众领域,很多影视作品和探索都认为,这一类机器人(仿生)可能才是人形机器人的最终形态。原来的智能设备更多是以语音交互的方式实现,但其实表情交互、肢体动作交互等方式是更符合人类交互的模式,会比纯语音交互的智能设备多很多维度。
双足行走的机器人,他们的移动能力或者说行走能力也是人类能力中的一种,但人类还有很多其他的能力,比如说话、观察和感知周围环境、手部操作、智能决策等,这些能力绝大多数都是在机器人的上半身来集成的,所以我们更多关注机器人的腰部以上。至于它的移动,未来在不同场景下我们会采用不同的移动方案,比如轮式、轮足,双足也是其中的一个。
从前双足机器人较为受外界关注,是因为很多高校和科研院所围绕机器人的项目都是从双足开始做起的,我们看到做双足机器人的就会很多。但现在包括马斯克也是投了大量的成本在人形机器人的上半身和灵巧手上。目前手部的动作是业内最为关注的,然后是与人类的交互能力。
EX机器人的仿生机器人产品 图片来源:每经记者 杨卉 摄
NBD:ChatGPT火起来之后,业界很多声音认为,人工智能会给人形机器人交互带来极大进展。就目前公司的实际情况来看,现在的交互是什么水平?现在人形机器人企业普遍是自研模型,还是用一些已经开源的通用大模型?
李博阳:大模型其实对我们的帮助非常大。最开始打造产品的时候,我们就定位要做一个AI的硬件载体。一方面,人形机器人是很好的通用型人工智能硬件;另一方面,大模型本身又是一种通用型的AI,不断生成的内容可以通过机器人的形态来传达,变成它的表情、语言、动作,是一个很好的结合点。
GPT最新版本出来之后,我们有一个直观的感受就是,它不那么生硬了,好像有情感了,这是我们在探索落地应用时非常需要的。要做有情感的人工智能,做有“人设”的机器人,那每一个产品都应该是有个性的,是不一样的。在实现机器人感知世界的能力时,人形机器人与其他类型的设备肯定是不一样的,需要它像人一样有视觉、触觉,甚至嗅觉、味觉等感知能力。希望我们的多模态大模型能够把更类人的数据采集能力融合进来,给出正确的反馈。
现在大部分人形机器人企业还是基于一些基础大模型自己做定制性开发,同时也在大模型的基础上做自己的模型,如情绪大模型、适用于表情的一些小模型、针对具体应用场景的系统等。我们也是这样的路线,公司与华为、科大讯飞、中国移动等企业都是战略合作伙伴关系。其实这些基础大模型大家做得都很全面,也不断地有大量的数据、很高的算力来支持,我们自身会做一些比较有特色的。比如基础大模型可能更注重知识体系,我们会更注重交互体验,会在情感、表情方面采集更多数据来训练,探索如何让机器人的行为更像人。
核心零部件自研降低了制造成本
NBD:您刚才提到正在考虑做面向C端的产品,请问有更详细的面向C端的计划吗?
李博阳:我们现在还没有完全面向C端消费的产品,有一款已经量产的人形机器人,今年发布后有企业购买用于展厅、营业厅、智能前台等场景了。这款机器人,现在的售价是税后接近80万元。
NBD:我们了解到,EX机器人的大部分产品没有像很多机器人公司一样直接出售,而是投放到了公司的线下科技馆等场所。请您介绍下公司线下科技馆的相关情况。
李博阳:我们线下的科技馆,大连和沈阳是最先建的两个,沈阳已经不仅是一个科技馆的形态了,已经发展成了科技文商旅综合体,既有科技馆,又有一条以人形机器人为核心的智慧街区,吃、喝、娱乐等所有业态均由机器人服务。
科技馆的客流量确实非常大,特别是每到寒暑假孩子放假后,基本上街区都是满员的状态,不少项目都是要排队的。我们现在的线下落地场馆已经能实现很好的营收,预计在3至5年内可以收回全部成本,快的话三年之内就可以实现成本回收。
我们目前正在洽谈线下文旅场馆的城市已经有20多个了,还制定了“百城百馆”的计划,希望未来国内主要城市都能有线下场馆出现。
NBD:单个线下场馆大概会配备多少台机器人?去年谈到人形机器人成本的时候您曾提到,单台人形机器人的成本约在300万至500万元,现在成本下降了吗?如果下降了,是否与人工智能的引入有关,还是某些配件价格下降了?
李博阳:我们每个线下场馆通常会配置30至50台机器人。成本方面,目前我们定制化的首台机器人基本上可以在150万元左右。其实现在这种机器人国外也有一些竞品,基本上一台机器人在300万至500万元。就我们目前的技术来说,可以在150万元左右实现首台产品的制造。如果是做同个产品的复制款,那价格就可以大幅下降到100万元之内。
价格下降的原因,首先在产品成熟的过程中很多模块已经定型了,生产研发的损耗降低了,减少了不断试验的过程。另外,我们的核心零部件已经实现了自研自产,尤其是电机部分,包括大型关节等。核心零部件完全自主可控后成本就大幅降低了。另外在算法的开发上,以前很多工作要自己进行,基础大模型出来后很多玩家都倾向于将已有的计算能力赋能给更多企业,降低了使用门槛。
以华为为例,一个是算力,包括云端的算力,超算中心等;另外一方面还包括了边缘侧和终端侧。我们现在正在做的就是把我们终端侧的算力能力建立起来,让每一个机器人自身就有计算能力和模型运行能力,从而大大提升交互速度。
真正面向C端还要10年左右时间
NBD:除了线下文旅综合体,公司还在尝试哪些应用场景?
李博阳:我们现在主要的市场在文旅场景,除此之外也在拓展教育、陪护这样一些面向C端的应用场景。比如我们的一款面向儿童及青少年的机器人,未来就可能会出现在智能教室成为孩子的伙伴,或是作为机器人老师和机器人“书童”出现。
另外一个比较受关注是可移动的家庭服务类机器人。这个机器人我们是把它和大模型做了结合,(机器人)可以通过视觉的方式来识别眼前发生的事情,再通过与用户的自由交流来进行情感交互。同时它还与智能家居和各种智能设备进做了打通。我们希望未来(人形机器人)能够实现智能化的家庭服务,可以在家庭空间内实现一定的路径规划,成为面向C端、走进家庭的产品。
NBD:现在很多观点认为,人形机器人到了“iPhone 时刻”,您是如何看待的?
李博阳:我觉得现在是到了示范项目逐渐落地的阶段,所有厂商都在找应用场景,也有很多企业还在实验室阶段,或是只有产品没有应用。我认为未来3年之内会有非常多的落地场景出现;3年到 5年时间里,这些场景会更加明确并迎来一个小的爆发期。但我仍然觉得五年之内人形机器人还是一个面向公共服务和工业应用场景的产品,没有到C端。真正到C端我觉得还要10年左右。
从竞争的角度看,这3到5年实际上是一个淘汰期。我们看到,近两三年内人形机器人企业大量出现,有些是带着场景来的,而有些企业还是以比较理想化的状态进入了这个行业,认为可以找到应用场景,但其实还是比较难的。此外,我们也注意到有产品出现了同质化的现象。可能细究技术路径会不太一样,但从现场和大家拍的宣传片来看,做的事情几乎都是一样的。所以这里面谁能够撑过这三年,谁能真的形成市场规模,我觉得是个考验。
(实习生简禹谦对此文亦有助益)
免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。