学界 | MIT和Google让AI获得多种感官协调能力

300 + 明星创业公司，3000 + 行业人士齐聚全球人工智能与机器人峰会 GAIR 2017，一同见证 AI 浪潮之巅！峰会抢票火热进行中。

今天特放出 直减 550 元的无条件优惠码（见文末，优惠幅度逐天减小），感谢各位读者对雷锋网的支持，打开链接即可使用。

AI科技评论消息根据MIT和Google研究人员近期发表的论文，他们正在训练AI将图像、声音和文字等多方面信息匹配起来。

在语音识别、图像识别以及下围棋等单项能力方面，AI已经足够出色，甚至超越了人类。但是如果AI一次只能使用一种感知能力，无法将看到和听到的内容进行匹配的话，就无法彻底理解周围的世界。这正是MIT和Google的研究人员进行这项研究原因。

研究人员并没有教给算法任何新东西，只是建立了一种方式让算法能够将多种感官获得的知识进行连接和协调。这一点至关重要。

论文的联合作者之一——MIT的AI博士后Yusuf Aytar以无人车为例：比如无人车的声音传感器先听到了救护车的声音，然后激光雷达才看到救护车的样子。有关救护车的鸣叫声、样子以及职能的知识可以让无人车放慢速度，切换车道，为救护车让路。

他说道：“你是先看到汽车还是先听见引擎声并没有关系，你马上能识别出这是同一个概念。因为你大脑中的信息已经自然地把它们协调统一起来了。”

为了训练这套系统，MIT的研究小组首先向神经网络展示了与音频相关的视频帧。在神经网络发现视频中的对象并且识别出特别的音频之后，AI就会尝试预测哪一个对象跟声音关联。比方说，招手会不会发出声音呢？

接下来，研究人员又以相同的形式为算法提供了带标题的图片，让它将文字和图片进行匹配。网络首先需要单独识别出图中所有的对象以及相关问题，然后才能进行匹配。

由于AI独立识别声音、图像、文字的能力已经十分出色，这种网络乍看之下并没有什么了不起。但研究人员表示，当他们对AI进行声音/图像、图像/文字的配对训练时，系统就能在未经训练指导哪个单词与不同声音匹配的情况下将声音与文字关联起来。这表明神经网络对于所看到的、听到的或者读到的东西已经形成了更加客观的看法，而且这种看法的形成并不完全依赖于它用来了解这一信息的媒介。

统筹对象的观感、听觉以及文字后，算法就能自动将听到的东西转化为视觉图像，从而强化对于世界的理解。

据悉，Google也进行了类似的研究，不过Google更加强调一点：新算法还能将文字转化成其他的媒体形式，虽然从准确率上来说，它暂时还比不上单用途的算法。

6月27日门票直减 550 优惠券

手慢过期

https://gair.leiphone.com/gair/coupon/s/5951ba9e144d2

优惠券仅限「参会门票」。赠送的优惠劵额度每天递减 50 元，有效期为 1 天，可供多人使用。长按复制链接在浏览器打开，或点击文末阅读原文立即使用。

点击文末阅读原文立即使用

AI科技评论招人啦！

作为国内顶尖人工智能学术媒体，AI科技评论一直秉承“洞悉学术前沿，连结产业未来”的理念，为读者奉上来自国内外的深度报道。

AI科技评论期待你的加入，和我们一起见证未来！现诚招学术主编（外聘）、学术编辑、外翻编辑等岗位，详情请 点这里

欢迎投递简历到：guoyixin@leiphone.com，AI 科技评论等你哦！

学界 | MIT和Google让AI获得多种感官协调能力

欧盟27国就对乌克兰安全承诺草案达成共识

广州民众强烈要求自来水涨价？参与投票的17人身份揭晓

马斯克：2024年可能是最后一次由美国公民决定的选举

现世报？内塔尼亚胡刚否认中国救过犹太人！上海就关闭了百年建筑

当11岁的孩子谈起妈妈的生死

广东揭阳一村电费从3毛涨到6毛8？官方：开展电网改造并实现抄表到户、同网同价

哈马斯女肉盾曼哈顿作死看着真爽，亲哈马斯国家上热搜

沈阳发布进一步促进外来人口落户若干政策措施

贵州一景点门票9999元，景区：科考价值高，每年只允许200人入洞

许可馨又大放厥词，却被全网点赞！这一次，反骨的她被谁包容了？

孩子在护照上盖“哆啦A梦”，妈妈出入境时被拦下

因“擦边”广告语被罚40万后，椰树最新直播模特全员捂得严严实实

一杯一度炒至300元，周杰伦带火的奶茶南京仅剩一家

网友开始风声鹤唳了，上海辟谣电费将涨价，气氛开始微妙了！

用户称“一觉醒来突然收到滴滴天价订单”，滴滴致歉

欧洲自然科学院：授予的"院士"名号理解认定标准不同

中国南水北调原副总经济师樊新中接受审查调查

12秒86！吴艳妮平赛会纪录夺得世界田联洲际巡回赛大阪站冠军

长沙望城麻将馆门口，因停车起争执，司机一刀把麻将馆老板捅了

微信、抖音集体发布公告

学界 | MIT和Google让AI获得多种感官协调能力

欧盟27国就对乌克兰安全承诺草案达成共识

广州民众强烈要求自来水涨价？参与投票的17人身份揭晓

马斯克：2024年可能是最后一次由美国公民决定的选举

现世报？内塔尼亚胡刚否认中国救过犹太人！上海就关闭了百年建筑

当11岁的孩子谈起妈妈的生死

广东揭阳一村电费从3毛涨到6毛8？官方：开展电网改造并实现抄表到户、同网同价

哈马斯女肉盾曼哈顿作死看着真爽，亲哈马斯国家上热搜

沈阳发布进一步促进外来人口落户若干政策措施

贵州一景点门票9999元，景区：科考价值高，每年只允许200人入洞

许可馨又大放厥词，却被全网点赞！这一次，反骨的她被谁包容了？

孩子在护照上盖“哆啦A梦”，妈妈出入境时被拦下

因“擦边”广告语被罚40万后，椰树最新直播模特全员捂得严严实实

一杯一度炒至300元，周杰伦带火的奶茶南京仅剩一家

网友开始风声鹤唳了，上海辟谣电费将涨价，气氛开始微妙了！

用户称“一觉醒来突然收到滴滴天价订单”，滴滴致歉

欧洲自然科学院：授予的"院士"名号 理解认定标准不同

中国南水北调原副总经济师樊新中接受审查调查

12秒86！吴艳妮平赛会纪录夺得世界田联洲际巡回赛大阪站冠军

长沙望城麻将馆门口，因停车起争执，司机一刀把麻将馆老板捅了

微信、抖音集体发布公告

欧洲自然科学院：授予的"院士"名号理解认定标准不同