打开网易新闻 查看更多图片

在往期的AI人物报道中,我们写过许多已毕业的清华校友,却没有邀请过一位正在就读的清华学子。从吴翼、朱海一、朱晨光、陈磊到鬲融、汪昭然,等等,他们无一不已在特定的研究领域成名,位居“小”有成就的学者。时过境迁,与80后的一代相比,90后的一代清华学子所面临的人生抉择,与对世界的思考,会是一样的吗?显然,答案是否定的。很少有人关注过:90后的一代,面对日渐撕裂的现实世界,被“内卷”、“佛系”裹挟的金字塔学子,是如何实现“自我拯救”的。一方面,行为进取、勤于竞争,容易被定义为“内卷”;另一方面,树立个人价值观,又容易被标注为“丧的一代”。所以,当北大校友当网红、清北毕业生当中小学老师为人诟病,拼了命做科研、发顶会的学霸,也不见得掌声满堂。大时代之下,一位手握近30篇顶会论文的清华AI博士生如何选择人生、看待自己?我们与来自清华大学自然语言处理实验室的四年级在读博士生韩旭聊了聊。

作者 | 陈彩娴

编辑 | 青暮

(一)

作为一枚资深权游粉,韩旭说道,他最喜欢的剧中角色是提利昂·兰尼斯特(韩旭称呼他为“小矮子”),因为他习惯用大脑思考,运用知识与智慧来解决问题,而非武力:

“在这部剧中,所有人都在讨论自己家族的命运,只有小矮子在考虑整个国家应该往哪发展。他关心的不是权力斗争,而是如何用权力去建设整个国家。”

与提利昂一样,韩旭也热衷于阅读经典,读一些人文社科类书籍,关注民生时事。这一点使他的谈吐有别于大多数思维抽象的理科生:谈起专业之外的社会议题,韩旭也能引经据典,抛砖引玉,结合自己与他人的思考进行一番严谨的论述。

比如,在继续对权游进行讨论时,韩旭又引用中国近代解放战争的例子来对他的观点进行了佐证:

“要想取得一场战争的胜利,不能光靠武力。解放战争时,共产党打败国民党,靠的也不只是战无不胜的军队,还有在解放区进行的土地改革等政策。就像陈毅元帅说的,淮海战役的胜利,是人民群众用小车推出来的。”

显然,韩旭对知识的力量是崇拜的。韩旭眼中的“知识”,也不仅是冷冰冰的科技,还有社会与人文。从本科开始,他的书架上便不只有计算机类的教材,还有许多社科类书籍,比如费孝通的《乡土中国》、蒋廷黻与徐中约的《中国近代史》,以及马伯庸的一系列小说。最近,他又开始看《毛泽东选集》。诚如他所说,这两年,“内卷”、“后浪”等名词被广泛讨论,他尝试用一种几十年前的、与现在有所不同又有所相同的视角来审视当前的社会生产关系,“依然感觉很受用。”

也许正是如此,当韩旭审视自己以及审视他人时,他的思考是圆润的,也是温良的。在谈到清北学子在深圳中小学竞争上岗、北大校友李雪琴当网红时,此前已有过相关思考的韩旭很快就提出了自己的观点:

“外界对清北的毕业生都寄予厚望,认为他们应该从事高大上的行业,比如做科研。但事实是,科研并不一定适合所有人。科研人才缺不缺?肯定是缺的,但不是所有人都能胜任,或适合。

理论上讲,如果国家要发展,未来所有行业的文化水平都会普遍提高,生产工具也在不断发展。无论是读到硕士生还是博士生,你在某个专业有了深入研究,最后还是要从事具体的工作。博士生去做基础工作,不一定是浪费。”

以自己为例,虽然韩旭也想一直从事科研,做一名高校教师,培养一代又一代做研究的学生,桃李满天下。如果在大学里无法谋得一职半位,他觉得去中学当一名教师也很不错。

虽然崇尚知识,但在韩旭的世界观里,个人的生活似乎才是讨论的中心。即使在讨论制度建设与人才培养等话题时,他的聚焦点也不仅是宏大的概念,更有人与时间的参与。

在清华,韩旭比大多数人更容易见识到大神风采。

与他同年入学的2013级学子中,就有一些少年成名之才,如胡渊鸣,人称“鸣神”,是“太极”(TaiChi)编程语言的发明者,因用99行代码就能打造冰雪奇缘而一举封神;陈立杰,2013年 IOI 金牌得主,多次获得理论计算机顶会STOC与FOCS最佳学生论文奖;范浩强,2011年 IOI 金牌得主,高二便被唐文斌拉去旷视创业,在清华读本科时用一半时间工作、一半时间学习还能保持连续四年姚班第一名的成绩,如今担任旷视算法总监……

除了同级的名人,韩旭在担任计算机系科协主席、负责举办活动时,也经常有机会见到以前清华的风云人物,比如王小川、楼天城。

仰望大神难免让人自觉沦为平庸之辈,本科时观看清华特奖颁奖时,韩旭也会感慨相形见绌,但在清华度过八年时光后,他的看法也发生了细微改变:即使在清华,风华绝代、国士无双也只是少数,踏实工作、中流砥柱可能更符合大多数清华人的平均形象。关于“伟大”的描述往往浮于表面,大多数人的成长更像是一幅立体的图像,不大的挫折与不小的成就交叠,起起落落,在时间的维度上一直前进。

(二)

2011年,高一的韩旭获得了NOI邀请赛的金牌,并因此被保送到了清华大学计算机系。他常调侃自己:“在清华计算机系,我不过是一个脚踏实地、安分守己的普通人。”

但事实上,在一众 AI 博士生中,韩旭并不“普通”。从某些层面来看,韩旭达到了世俗对清华学子的期许,既勤苦修学、实用知识,又敢于担当、热心助人:

在科研上,得益于信息学竞赛的背景,他从大一就开始进实验室做科研,2017年本科毕业后直博清华,博士刚开学就中了第一篇顶会一作,之后几年也比较高产,目前博士四年级在读,却已手握将近 30 篇 AI 顶会论文,出版过学术专著,获得过大大小小十多项奖学金,还入选了2020年“微软学者”。

在为人处事上,他一直奉行“穷则独善其身,达则兼济天下”的信条。

90后的一代,又被称为“冷”的一代,归因不外乎独生子女的成长模式、网络通讯的发达、个人主义的觉醒等。但在韩旭的身上,仍可见一丝“修身、齐家、治国、平天下”的复古。在“独善其身”之余,韩旭一直热心于以“微薄之力”帮助他人,即使在制定职业目标时,他所选择的也是“知识改变人生”的教职。

从大二开始到本科毕业,他在计算机系学生科协干了三年,读博后也继续做着计算机系的辅导员,和学生科协有着千丝万缕的联系。

国内高校并没有硬性要求博士生读博期间必须要做助教的要求,但韩旭还是在繁重的科研中挤出时间,担任一些本科生课程的助教。他的想法是:“我当助教,把这门课的内容搞好一点,同学上课上得舒服一点,还挺有满足感的。”从本科到现在,他已经当过三门课的助教,分别是《软件工程》、《面向对象程序设计基础》与《写作与沟通》。

只是,相比传统士大夫将饱读诗书与仕途平坦相捆绑的做法,韩旭是“冷”。这种“冷”,更多是体现在对头衔追求的漠视,对名利荣誉的淡然。在审视自己的“成功”时,韩旭是谨慎的:“如果只是发论文,但不是那种开创式、奠基式的工作,即使论文数量很多、引用数也不低,总感觉差了那么点意思。”

他将自己的学术成果归功于组内的合作与导师的指导。“这个没什么好强调的,主要是归功于清华的平台,还有计算机行业的发展。一个人的命运,要靠自我奋斗,也要考虑到历史的进程。”

打开网易新闻 查看更多图片

图注:2021年2月2日,团队刚投完ACL,兴奋合影

韩旭的研究方向为自然语言处理,师从刘知远孙茂松,隶属于知名的清华大学自然语言处理实验室(THUNLP)。由孙茂松老师领导的THUNLP是国内自然语言处理领域具有重要影响力的研究团队之一,除了在国际顶会上有颇多斩获,也培养出了许多优秀的「NLPer」,包括韩旭的导师刘知远(现任清华大学副教授)、师兄涂存超(幂律智能创始人)等等。

韩旭解释,他之所以能在博士刚开学就中顶会论文,是因为他从本科就开始进 THUNLP 实习、做项目。

当时,大一刚开学,得知刘知远老师在招募实习生,韩旭毫不犹豫就报了名,和班上另外三个同学加入了实验室,在学长的指导下开发了“微博关键词”的趣味应用。这个小小的成就使他很早就找到了自己未来的研究目标:“这个应用从部署到最后结束维护,访问次数一共超过了3000万次,大家就感觉做自然语言处理还挺好玩的。我们几个,除了我,徐磊去了MIT读博,郭志芃去了幂律智能,跟涂存超师兄一起创业、当联合创始人了。”

当知识图谱被公认为是实现机器理解人类语言的有效途径之一时,韩旭跟随刘知远老师在该方向上率先探索,一个课题不断修改、实验、打磨,最后在临近大四结束时投出文章,所以在博一刚开学时就接到了论文被接收的消息。随后,他在读博时继续围绕如何在自然语言处理中知识的获取与理解进行探索,进展也比较顺利,取得了不错的成果。

说起来,韩旭的博士导师刘知远也是国内自然语言处理领域有名的年轻学者。他的求学经历也与刘知远相似:本科与博士都是就读于清华大学,也是在THUNLP做研究。韩旭谈到,他选择留在清华读博的一个重要原因,就是因为觉得与导师兴趣爱好相似,三观相近,沟通起来比较顺利:

“我导师之前也是一边做科研、一边做辅导员,也喜欢看各种各样的历史书籍、语言学书籍和哲学书籍。感觉和我很像,专注本职工作之余,也会关注专业以外的领域,世界观也很宽广,对事情有自己的看法。”

(三)

韩旭想赢吗?答案不言自明。

从大一争取进实验室,到读博期间保持稳定的论文输出,韩旭都不掩饰自己是一个目的明确、也会积极争取的人。比如说,他想从事大学教职,面对竞争日益激烈的大环境,也计划博士毕业后再读一个博士后(postdoc)。

但与此同时,他又很坦然,论文被接收也好,被拒也好,他都是无所谓的:“好比我打游戏,想赢不想输,但输了也不会特别难过,感觉过去了就过去了。辩证法讲对立统一,可能这就是对立统一吧。”

韩旭从小热爱历史,“没搞竞赛之前,一度想去当考古学家。”在史书里见惯了人生的起伏,以及朝代的兴衰更替,韩旭不执着于输赢,对当下的评价也习惯于拉长视角,从宽阔的时空中看待事物的“伟大”与“渺小”。

比如,2016年AlphaGo打败世界冠军时,韩旭看到新闻,只觉得是浩瀚历史里的一个小节点:“讲道理就算击败了也不意味着什么,机器本来就是为了在某方面击败人类而生的,不然要它何用。折腾了大几十年,耗费这么多还在弱智能状态,不得不说人的智能本身是多么奇妙和复杂。”

他将自己的论文成果归功于组内合作紧密、计算设备充足时,对比了过去与现在的科研方式差异:

“过去是欧洲“贵族式”的科研方式,只有一小拨人,一个小圈子,他们就可以安安静静地做研究,整个科研行业的变化也不会那么快。现在的科技更像工业化时代里的一个产业,发展速度特别快,更新换代的速度也特别快,所有人——无论是天才还是普通人——都只是这个行业里的一枚螺丝钉。”

工业时代,福特生产方式浸透到各行各业,分工合作成为主题,科研领域也不例外。比如一篇重要学术工作的形成,就像一辆汽车的组装,分成不同的部分:需要精妙的算法构思,需要复杂的设备支撑实验、需要严丝合缝的逻辑推演与写作……

当合作成为大势所趋,在自己的领域开辟一条新的赛道,也不再是一件容易的事。

韩旭以自然语言处理研究为例:“GPT-3给大家的印象很深刻,但如果你要训练一个超级大的模型,这就要有大量的分布式计算资源,而这些计算资源就涉及到另一个研究领域,即高性能计算,这就不是我们(NLP研究员)擅长的事了。现在很多重大研究都是复合式的、交叉式的,要一帮人才能完成,一个人是做不成的。”

对于奠基性的工作,韩旭自然是向往的:“如果有一天,我能有一篇奠基性的工作,我的脑袋出现在教科书上,我会感觉很满意。”但随即,他又说道:“但可能一辈子也做不出这种开创式的成果。这个也说不准。就做好自己的事吧。正如《增广贤文》所言,但行好事,莫问前程。”

谈起读博期间的成果,韩旭最自豪的不是论文高产,也不是整理实验室成果出版的《知识图谱与深度学习》,而是在GitHub上开源和维护OpenKE、OpenNRE项目,分别针对关系抽取和知识表示学习的论文进行了系统梳理,这些项目在开源社区获得了不小的关注量(超过8000颗星)。

一方面,论文高产多少归功于组内合作与导师指导,而工具开源工程由韩旭和实验室同学一砖一瓦地搭建;另一方面,他认为,相比非奠基性的论文工作,开源工具包可以让大家实际用起来,推动大家的工作。

韩旭曾与实验室同学一起做了一个少样本学习评测平台,感觉这个过程比改进模型更有意思:从研究、评测到做工具包,开源,维护,把整个体系搭建起来,为后来的研究者提供基础。最近半年,他也投入到实验室大规模预训练语言模型的工作中,和实验室以及清华计算机系高性能所的同学们一起做模型加速。他们训练出的CPM-1、CPM-2模型发布在了2021年北京智源大会上。

图注:韩旭参加2021年北京智源大会

(四)

不难想象,身兼数职的韩旭很忙,经常分身乏术。读博期间,他除了做研究,还要维护开源工具包、备课,回复学弟学妹的咨询。随着事情的增加,他的业余时间越来越少,不得不开启了常年熬夜模式。

本科那会,他常在朋友圈抱怨清华的课业繁重,直言不讳,颇有一番码农的俗雅之风:“三周小学期不知道折了多少阳寿”;“垃圾代码,不写注释,毁我青春,颓我精神,耗我感情”;“五天码了60k,bug调了一坨坨,调参数等结果和老中医有的一拼,谁说图形学水的,我绝对不打死你。”

到了博士二年级,韩旭已经被磨得没有脾气,朋友圈只留下了一句无奈的《空城计》摘曲:“我本是卧龙岗上散淡的人……现在是掉发写论文的科研狗。”

“好多时候太累了,都来不及去解决大家提的需求。”韩旭感叹道。但问到如果重返大一、是否还会选择进实验室做科研时,韩旭还是毫不犹豫:“进呀!干嘛不进?以前是科研设备不多,很难有机会早早尝试做科研。现在有资源了,干嘛不做?”

虽然很忙很累,但韩旭觉得,读博仍然是他做过最对的选择之一。

临近本科毕业时,他也曾纠结过,是读个硕士直接工作,还是选择读博。“年少时总会有一些躁动,想要做不一样的事情、体验不一样的人生。现在也许是年纪更大了,看待世界与看待自己的方式都有了改变,我发现自己还是更喜欢简单的、安静的生活,做学术研究,教书育人,写点代码,桃李满天下就更好了。”

“可能人就是这样的。本科的时候觉得自己超级忙,读了博士后才发现还是读博更忙。可能工作之后,又发现还是工作更忙,读博也挺舒服的。”

写段子与背古文,是韩旭在朋友圈宣泄压力的渠道之一。

调参数调到烦了,随手写下一句:“小火喂药,大火炼丹。”百忙之中组织社团活动,直接调侃ETC是“一年一度的骗吃骗喝,顺带炒股的刺激性比赛”。情到深处,爱面子,不想直抒胸臆,就借助古人的话:“流萤断续光,一明一灭一尺间,寂寞何以堪”;“恋他朝市求何事,想取丘园乐此身”;“金古梁温黄,五人去其四”;“苟利国家生死以,岂因祸福避趋之”;“严冬数九人难处,酒浊一壶谁与图”……

如前所述,韩旭是一个历史迷。在繁重的科研生活中,能满足韩旭“一点私心”的事不多,除了能偶尔与志同道合的博导聊侃,就是疫情前每年都能出国参加顶会,见识之余顺便打卡世界文明旅游景点。

韩旭有一个世界文明打卡计划。在上小学与初中那会,他还没有完全投入计算机的怀抱,经常看一些有点“民科”的世界未解之谜和世界地理历史类书籍,也很喜欢玩帝国时代、钢铁雄心、文明之类的游戏,对世界各国文明十分神往,便给自己定下了目标,要去东南亚解锁占婆、高棉、暹罗,还有到美洲解锁奇琴伊查、特奥蒂亚坎等等地方。

“世界上有很多不同的国家、不同的文明,有的文明已经镶刻在历史里。古时的人已经不在,但一些物质的东西可能还在。我们生活在这个时代,但再过100-200年,我也会成为历史。想到这一点,我就很想去这些地方看一看,看看历史上各个地方的人当时是什么样的状态。”

2019年,韩旭前往佛罗伦萨参加ACL2019时,途径罗马,开会前一天就在罗马城逛了一圈,十分开心:“罗马城的建筑十分集中,而且风格多样,很好逛。我们回国之前还在飞机上玩起了‘精罗震怒’的历史梗。”

图注:韩旭在罗马城留影

从大学到现在,韩旭已经去了一部分地方,但有些地方再也无法成行,比如叙利亚的首都大马士革。大马士革一度是中东的中心,阿尤布王朝的萨拉丁就在此定都,在伊斯兰教文化中的地位十分重要。叙利亚战争爆发后,大马士革被炸得粉碎,即使再去,也无法再亲眼见识其本来风采,这让韩旭十分遗憾。

现在,科研之余,韩旭也还是会抽空看一看历史类的读物,在B站上关注“稚嫩的魔法师”。

少年时代,他喜欢看世界史,尤其是中世纪史,现在更喜欢看中国近代史。他的心态也发生了转变:“以前更多是希望了解世界,现在是更希望了解中国。我可能有点本土情结吧。”

除了历史书,他也会看一些社科研究者写的分析与见解类文章:“他们会用一种体系化的方式帮助你了解整个社会运转的内在逻辑与历史发展规律。我们离不开社会,所以了解社会的运转规律还是很重要的。”

(五)

正如“清华的学生也会在课堂上睡觉”一样,韩旭对现实的关注与焦虑,与多数普通学子无异。在思考毕业留京问题时,他曾调侃自己:“听说清华工科男值500万,曾经想过把自己卖了,可以在北京买间厕所。”

也与许许多多身处瞬息万变的时代而无法为生活做准确预测的95后青年一样,韩旭虽思考未来,但也不敢作太多设想,没聊多久便刹住了话题:“这个问题很复杂,不能细想。”

韩旭的理想是当一名高校教师,从事科研一辈子。从某种意义上讲,这并不是一条容易的道路,但抛开现实的考量不谈,韩旭引用诸葛亮《诫子书》中的一句话来勉励自己:“静以修身,俭以养德。非淡泊无以明志,非宁静无以致远。”

他信奉“尽人事、听天命”。虽然常听别人说“站在风口上,猪也能飞起来”,但比起寻找“风口”,韩旭更关注如何把分内事做到最好,至于成功与否,他总是随缘,毕竟“成功有很多随机因素,天时、地利、人和缺一不可。”

无论“内卷”或“佛系”,都不足以诠释一代人的面貌,即使它们都是时代的产物。卷外人顾自评头点足,卷内人也仍在自己的赛道上努力奔跑。只是,对于竞争,对于名次,对于荣誉,多了一分清醒,还有一分豁达。

“你的分数比别人高,难道就代表你比别人优秀吗?”韩旭这样说道。

相比对随机结果的执著,韩旭更愿意追求自己能把握的事情,比如自由地做自己实实在在感兴趣的研究。自然语言处理的终极目标,是让机器能完全理解人类语言。而韩旭的研究期望,也是终其一生,为这个大目标的实现推进一小步。

至于前程几许,再另当别论吧。

作者注:人物/采访、交流、爆料、抬杠,欢迎添加微信(302703941)。参考链接:1. https://mp.weixin.qq.com/s/r6xPaC9kLdtsnYQXCAlbSA2. https://www.noi.cn/hjmd/mdgs/2011/2011-08-16/710341.shtm