打开网易新闻 查看更多图片

在将门-TechBeat人工智能社区上线一周年之际,我们评选出Top30进入 ,同时我们也潜心策划了AI工作者人物专访栏目「AI红人荟」,带大家更深入地了解他们个人成长的心路历程,感受来自青年科学家们的榜样力量。

本次为大家带来的是——清华大学交叉信息院助理教授·赵行的故事。

AI红人荟 系列回顾:

| | | | 田值

作者 | 解亦鸿

2020年底,赵行离开了供职一年半的Waymo(谷歌旗下的自动驾驶公司),来到清华大学交叉信息院担任助理教授。在这里他成立了自己的实验室,起名为MARS Lab,像人类探索火星,赵行希望自己的实验室不被研究领域所定义,永远在寻找新的问题。他是一个纯粹的研究者,始终走在探索的最前列,喜欢研究,也活在了研究里。

01

重新定义问题的能力

在清华,他找回了五年前读博时那种生活方式,时间安排很弹性,但工作强度很大。在晚上甚至周末,只要灵感来了,他就会坐到办公桌前开始研究,或去和组员交流讨论。

赵行在北京讲课

赵行不喜欢像朝九晚五一样区分出严格的工作时间,当外界都在追求某种量化指标,赵行则依靠内在的自我驱动,不断探索着新的问题。

赵行来到Waymo的本意是希望研究多模态的学习与感知问题,但是经过一段时间的探索后,赵行发现,运动预测是自动驾驶当下面临的瓶颈问题,以此为切入点,他和合作者发明了一种目标驱动轨迹预测(TNT)框架,以及一种矢量化的地图编码方式(VectorNet),可以更有效地预测车辆和行人未来的运动轨迹。这系列研究成果入选了机器人顶会CoRL 2020和视觉顶会CVPR,并且在自动驾驶行业里产生了重要的影响。

除了运动预测,赵行还关注自动驾驶的其它问题,比如视觉为主的自动驾驶方案和运动规划。但是,公司有鲜明的部门分工与业务规划,“想做的”多于工作框架下“能做的”,这让赵行觉得自己无法完全施展手脚。

回到学界,成立自己的研究小组,赵行在科研上的热爱有了更自由的出口。在MARS Lab,6个月的时间,他带领组员完成了3个多模态学习的项目,这些项目能让机器获得类人的感知,通过视觉、听觉、触觉等多种感官来理解世界,帮助人类做出更好的决策,甚至操控这个世界中的物体。

赵行根据数据和问题来源定义研究小组的两条实验路径。一条是在互联网世界,收集图像、声音、文本,利用这些数据,他们的工作可以让机器变成声优,学会给电影配音。另一条是在物理世界,用雷达、摄像头等搜集数据,这条路径则通向多模态学习最大的应用场景:自动驾驶。

这种定义方式隐藏着的,是赵行始终希望向前沿再多迈出一步的决心。赵行的研究伙伴发现,生活中,赵行更喜欢讨论一个问题“应该”怎么解决。在Waymo这样的计算机应用领先企业,赵行观察到,最前沿的研究者们往往不会拘泥于问题解决的模型,而是在此之上,对问题本身给出一种“再定义”:

“大家想要实现的最终目标往往都是一样的,比如让自动驾驶更精准、更好。但是,如何定义实现这一目标里面的具体问题,不同的研究者都会给出不同的路线。比如Waymo建立之初将自动驾驶问题切分为具体模块分布式地解决,而特斯拉的工程师则认为应该尽量采用统一框架端到端的数据驱动解决问题。”

在赵行眼中,“定义问题”本身是一种需要锻炼的能力。旁人看来,这样的科研态度或许会让赵行在Paper发表和成果落地上,显得不紧不慢。但是正如MARS(人类探索火星)这样的名字,他对自己的实验室有一个浪漫的野心:“我们也要有自己的能力来重新定义问题,做出第一个demo,告诉世界,‘原来问题可以这样解决。’”

打开网易新闻 查看更多图片

赵行在Google

02

不被特定的研究领域束缚

MMML Lab( Multi-Modal Machine Learning )是赵行给自己的研究小组最初设立的名字。很快,赵行发现这样的命名方式与自己的研究理念并不相符。他希望这个小组不被自己的领域所束缚,于是将其改名为MARS Lab。

赵行与MARS Lab小组合影

“不被特定的研究领域定义”,这像一个线索,贯穿了赵行从硕士至今的整个研究历程。他对各个领域都很好奇。2018年,赵行在将门做了第一次Talk,他很喜欢这样的社群,“因为在学术会议,演讲者会假定听众是对某个特定研究领域有一些基础了解,但将门的内容是让想要认识一个新领域的人也能理解吸收。”

【像素之声—图像和声音的跨模态自监督学习】Talk观看地址:

https://www.techbeat.net/talk-info?id=248

【自动驾驶中的运动预测】Talk观看地址:

https://www.techbeat.net/talk-info?id=478

他很擅长在某一时期持续地投身到一个研究议题中,之后又会转身进行另一个领域的研究。他认为自己是一个“兴趣导向”的研究者,没有限制和规划,只会根据自己的兴趣,找到一个很好的切入点,然后深入进去,把问题做透。

自2013年在MIT修读硕士和博士开始,赵行所有研究内容都与应用相关,他很清楚地知道,自己就是喜欢、想做应用研究。但他不会“拿着锤子找钉子”,所以他喜欢和业界交流,找到问题在哪里,再回到学界,用学术的方法解决。

赵行与MIT实验室组员合影

2015年,研究高动态范围成像问题时,赵行选择的方法是重新设计一款新的相机,他的“余数相机”成功让照片有更高的动态范围。2018年,研究语音分离时,赵行选择了音视频学习的方法,提出了“像素之声”的概念,帮助解决了语音领域最有挑战性的“鸡尾酒会问题”。

正如清华大学交叉信息院姚期智先生对研究者的建议:“Don't beat the dead horse.”当赵行把一个研究问题做透之后,他也总能很潇洒地投身到下一个大问题里。

03

两个纯粹的研究者

Antonio Torralba,麻省理工学院人工智能和决策系的主任,是赵行博士时期的导师。赵行说Antonio从来没有刻意地培养自己,可是在这个用心的学生身上,你能很容易地看到老师的影子。

在赵行眼中,Antonio是一个非常纯粹的研究者,纯粹到“他几乎没有进行管理”——从不给学生布置任务,这位老师和学生交流的方式是,每当他发现一个自己感兴趣的问题,会把想法分享给学生,问学生“有没有时间来帮忙研究”。有时,因为自己对研究课题的兴趣过于浓烈,老师还会忍不住自告奋勇,帮学生完成一些基础的工作:赵行研究“像素之声”的问题时,Antonio帮他画了第一个Figure。

Antonio常对学生说:“你们不够naive。”他希望学生是纯粹的,不应该总想要做一些容易发论文的工作,而应该去探索真正有价值的东西。内在的自我驱动,是他最看重的品质。显然,他有一位学生做到了。

打开网易新闻 查看更多图片

赵行与Antonio Torralba的合影

今年是赵行从MIT博士毕业的第三年,当被问及有什么学习经验可以分享给将门的小伙伴,他仍然给出了和老师相似的回答:用最纯粹的心态去面对研究。

而他自己,就是这份回答的样本。回国半年了,他还没好好逛过北京,做研究成为了他的生活之一。不理解的人会说,他不够“躺平”,但是对赵行自己而言,这只是一个找到自己热爱的人,享受生活的模样。

- The End -

「AI红人荟」系列回顾:

‍‍‍‍‍‍‍‍‍‍‍‍‍

[2]

[6]

[7]

[8]

[9] 腾讯Robotics X实验室高级研究员 李珽光

[10]

如果你想和他们一样,亲自来到TechBeat分享,或者想推荐身边闪闪发光但是尚未入驻社区的AI工作者——欢迎填写下方表单自荐/推荐,说不定明年的TechBeat红人荟专访,主角就是你!

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>