人工智能破圈后逐步退烧,谷歌又在憋大招了。据公开信息发现,他们正在开发一种AI驱动的机器人,名为RoboCat,这种新技术能够实现机器人的自我改进。

打开网易新闻 查看更多图片

RoboCat是DeepMind开发的一种自我改进的机器人代理。它能够学习在不同机械臂上执行各种任务,然后自我生成新的训练数据来改进其技术。RoboCat是第一个能够解决并适应多个任务并在不同的真实机器人之间进行切换的代理。它比其他最先进的模型学习得更快,因为它可以从大量丰富多样的数据集中学习,只需100次演示就能掌握一项新任务。这将有助于加速机器人研究,因为它减少了人类监督训练的需求,并且是创建通用机器人的重要一步。

RoboCat的训练数据包括来自真实和模拟机器人臂的数百万条轨迹,包括自我生成的数据。我们使用了四种不同类型的机器人和许多机器人臂来收集代表RoboCat将被训练执行的任务的基于视觉的数据。RoboCat从多种类型和任务的训练数据中学习:真实机器人臂捡起齿轮的视频,模拟机器人臂堆叠积木和RoboCat使用机器人臂捡起黄瓜。它还能够在不同的机器人身体之间切换,并比正常情况下更快地掌握新技能。

RoboCat的技术改进是通过一个“自我改进”训练周期来实现的,该周期包括五个步骤:

  1. 使用人类控制的机器人臂收集100-1000个新任务或机器人的演示。
  2. 在这个新任务/机器人上对RoboCat进行微调,创建一个专门的旋转代理。
  3. 旋转代理在这个新任务/机器人上平均练习10000次,生成更多的训练数据。
  4. 将演示数据和自我生成的数据纳入RoboCat现有的训练数据集中。
  5. 在新的训练数据集上训练一个新版本的RoboCat。

RoboCat是第一个能够解决并适应多个任务并在不同的真实机器人之间进行切换的代理。它比其他最先进的模型学习得更快,因为它可以从大量丰富多样的数据集中学习,只需100次演示就能掌握一项新任务。这将有助于加速机器人研究,因为它减少了人类监督训练的需求,并且是创建通用机器人的重要一步。

打开网易新闻 查看更多图片

RoboCat的三大优点很快也就总结出来了:

  • 它能够快速学习新任务,只需100次演示就能掌握一项新任务。
  • 它能够在不同的机器人身体之间切换,并比正常情况下更快地掌握新技能。
  • 它能够自我生成新的训练数据来改进其技术,从而加速机器人研究。

当然,RoboCat也存在一些问题。例如,在DeepMind的测试中,RoboCat在不同任务上的成功率差异很大,从13%到99%不等。这意味着它在某些情况下可能无法成功完成任务。此外,尽管RoboCat能够快速学习新任务,但它仍然需要一定数量的演示才能学习新任务。这些都是需要考虑和解决的问题。

人工智能机器人未来将会在许多领域得到广泛的应用。例如,在医疗保健领域,机器人可以帮助医生和外科医生进行手术,以减少潜在的致命暴露。此外,人工智能也可以帮助机器人在汽车制造业中执行重复、疲劳和危险的任务。在农业、国防和娱乐等领域,人工智能机器人也有广泛的应用。

最后强调一下机器人的安全性是一个非常重要的问题。为了确保机器人的安全性,研究人员正在开发各种技术和方法。也是全球诸多机构都在关注和研究的方向。

打开网易新闻 查看更多图片

基于人工智能与机器人等多种技术的协同发展,就可以预见未来的机器人宠物,它能够学习各种技能,帮助你完成各种任务,也会自我学习迭代变得越来越聪明和熟悉适应环境。那么机器人走入普通人的生活也会不再遥远。