人类获得讯息90% 以上是依靠眼睛的。然而,对于机器人来说,“眼睛”也同样重要。

对于计算机来说,它们的“眼睛”就是计算机视觉感知技术。这项技术让计算机可以观察感知,并且通过观察到的东西来引导自己的行为,更好地与人类相处、提供服务;让只会执行命令的机器人,变得更有智慧。

作为“机器人之眼”,计算机视觉感知技术的实现可能是一个导盲眼镜,帮助盲人去“看”和感受他们周围的世界;或者是更聪明的家用机器人,重建整个家庭地图,更好地完成主人的指令;还有可能是更勇敢的工业机器人,灵巧地避开障碍、规划路径,代替人类到各种危险和恶劣环境中完成任务……

百度机器人视觉开放平台希望为所有的智能设备加上一双像人类一样灵敏的眼睛。

百度机器人视觉开放平台

ai.baidu.com/solution/roboticvision

打开网易新闻 查看更多图片

不同于市面上所有别的机器人视觉模组,百度机器人视觉是市面上唯一既有导航定位(SLAM),也有物体识别(人脸识别、物品识别、OCR 识别)的机器人视觉 SDK,并且是唯一开源硬件的视觉模组。(

开源方式详见文末)

日渐强大的视频理解技术正在把一双双超级智能的“火眼金睛”变成现实,如果把这眼睛嵌入到机器里,那机器就可以像人一样“看懂”这个世界。而这,也正是百度机器人视觉开放平台所追求的。

[ SLAM ]

机器人 SLAM 采用双目视觉惯性算法,定位结果延迟小、误差低。SLAM 针对机器人优化,可以覆盖大范围的复杂场景。

[ 障碍物检测 ]

双目摄像头获取的图像经过深度神经网络,得到准确完整的障碍物信息。

打开网易新闻 查看更多图片

[ 地图建立 ]

地图建立算法利用 SLAM 的定位对障碍物进行拼接,得到平面二维地图,帮助机器人在环境中自主地行走。

[ 人脸识别 ]、[ 身份识别 ]

机器人视觉解决方案连接百度云端 API ,人脸识别可以在多至数万人的数据库中快速准确地找到当前用户的信息。

[ 物体识别 ]

物体识别可以识别出各种商品和物体:

打开网易新闻 查看更多图片

[ OCR 功能 ]

OCR可以进行文字识别:

在机器人产品中安装百度相机模组,模组输出的图像和传感器数据输入百度机器人视觉 SDK。在 x86 或者 arm 平台上 SDK 可以实时提供定位和避障信息,同时连接百度AI平台云端,提供人脸、OCR、物体识别等功能。

机器人视觉答疑时间

看过前面的图文介绍之后,相信大家也跟小编一样,对百度机器人视觉平台的技术和应用有了更多的好奇。那么,下面就是百度技术专家的“随堂答疑”时间啦:

┇Q:百度AI小编

┇A:百度机器人视觉技术团队

Q:室内定位依据的什么技术原理?

A:专业版:Sliding-window Visual Inertial Odometry + global optimization.

科普版:利用摄像头实时捕获的图像,计算出场景中物体的三维位置,同时利用惯性传感器的数据提高定位的准确度和速度。

Q:障碍检测的最远识别距离是多少?

A:开源的双目硬件模组让客户可以进行灵活的双目配置。利用百度方案,机器人可以检测到近至10厘米、远达100米的障碍物。

Q:地图建模的更新周期是多久?

A:第一次在陌生场景使用,需操作员控制机器人记录环境。之后机器人在场景中运动时,会自动更新地图。地图数据包括用于定位的离散点云,用于导航的二维地图,以及自动识别到的物体的位置。

Q:人脸识别中,人种是如何判定的?

A:基于深度学习研究院三年来一致开发的人脸识别算法,我们可以识别人种,年龄,表情,性别。其中人种识别利用了轮廓,颜色,五官,和很多机器自动学习到的脸部微妙特征。

Q:物体识别功能如何区分实物和照片?

A:区分人的照片和实物有专门的算法,细节涉及到安全机密不能透露。

对于一般物体识别,双目摄像头可以捕捉物体的三维结构。如果是一张照片则是平面,如果是真实物体则应该满足合理的三维尺寸。

Q:相比单摄像头方案,双摄像头方案有哪些优势?

A:双目摄像头和单目相比,只是轻微增加了成本,但是在避障可靠性,SLAM精度,和活体检测准确度方面都有巨大的性能提高。

Q:未来计划机器人视觉的应用方向是?

A:安防机器人:百度机器人视觉方案让安防机器人进行大范围自主行走巡逻,躲避路途中的障碍物,自动检测异常情况。

服务机器人:让服务机器人在房间内进行可靠的自主行走,躲避运动中的人体和障碍物,以及和人类进行自然交互。

家用机器人:让扫地等家用机器人用最低成本实现自然人机交互,室内场景导航,家庭视频监控。

玩具机器人:让玩具机器人用最低的成本实现有趣的人机互动,安全的小范围自主行走。