打开网易新闻 查看更多图片

魏忠钰

复旦大学大数据学院副教授

约2021级星友、复旦大学大数据学院副教授魏忠钰做“今日启明星”专访有两个触发因素,一个当然与他正从事的课题人工智能、自然语言处理有关;另一个是2022年12月9日他参加上海市科技党委召开的青年科学家学习二十大精神座谈会,会后为做报道笔者曾请魏忠钰看一下他的发言摘要,稿子发过去一天未回,笔者再询问时忠钰告知他发烧两天了,但他说当天一定会反馈改稿,果然很快反馈了修改意见。这个细节让笔者记住了他。于是有了这次对魏忠钰星友的采访。

那天提前几分钟进了忠钰星友的办公室,门是开着的,起着一点遮挡作用的门帘是有点道家风格的字画,上书“且慢”两字。进屋见桌上散放着《世界科学》《艾伦  · 图灵传》等书刊,旁边是一个敞开的书橱,里面夺人眼球的是一组《灌篮高手》的手办。书橱里书不少但放置有点乱,有机器翻译、人工智能、语言本能等专业书以及《世界简史》《创新的起源》《羽生结弦王者之路》等读物,或许反映出主人的阅读面。几分钟后身着淡色夹克衫的忠钰拎着两杯咖啡进屋,感觉他比12月参加座谈会时的状态更好。我们就在小圆桌旁面对面开始了采访。

学习上的两次追赶

学生团体中初露才华

1987年出生的魏忠钰是温州平阳人氏,因为父亲工作的原因,他的童年在内蒙古满洲里的矿区度过。在他的回忆中:冬天很冷,雪下得很厚,矿区的草原不算肥美,但很开阔,同龄的孩子们在草原上奔跑玩耍,无拘无束。这段记忆虽然模糊,但很让他留恋。5岁的时候,忠钰随父亲回到平阳,开始了求学生涯。

他的学习成绩一直不错,但让他骄傲的却是文体活动上的突出表现。小学、初中时,他参加讲故事、演讲、辩论等活动,在镇上和县里都拿过名次。从小在满洲里长大,他的普通话比土生土长的平阳人好不少,这为他赢得了不少展现自己的机会。人生起步时的这一点点不同给了他比别的孩子多一点的锻炼以及由此收获的自信。他认为满洲里的童年带来了人生最初始的好运气。

忠钰在高中时考到县里最好的学校——平阳中学——这是一所省重点高中。初入校的时候,他的成绩是倒数,这开启了他人生的第一次追赶。从入学的300多名,到毕业时的30名。这个过程中,他体会到专注做事带来的好处,学习过程中努力都是有回报的。高中毕业,他北上求学,入读哈尔滨工业大学,学习计算机专业。

与高中境况类似,初入学时,他的成绩并不理想,但凭着一点点熟悉学习环境,进入学习状态,本科毕业时,他顺利拿到保送研究生的资格。这两段从“吊车尾”到“优秀分子”的经历,一定程度上磨炼了他的心性,让他明白想要在环境中凸显出来,是需要付出努力的。

除了学习这条主线,忠钰在学生工作方面也投入了很多精力。高中阶段,他就是学校的团委副书记,而在哈工大时,他从学院的学生会部长、主席一路做到校学生会的副主席,并在大三时获得“黑龙江省优秀学生干部”的称号。学生社团的工作经历给了他很大的锻炼,让他可以比较自如地协调团队工作,也为他培养了强烈的集体意识。他说:“跟学生会那些同学通宵筹备活动的日子,真的很开心。那种一群人朝着一个目标迈进的感觉很棒。”

从哈尔滨到大湾区

初入自然语言处理领域

大三下学期,忠钰开始思考自己的未来发展规划。虽然学生工作经历给他带来一些光环,但他也隐隐感觉到专业能力才是一个学生的核心竞争力。看到周围同学加入学院的学术实验室,参加计算机编程比赛,他内心开始蠢蠢欲动。在主动参与过两个学术实验室的活动之后,他决定加入智能技术与自然语言处理研究室,跟随刘秉权老师开展本科毕设的研究,课题是“垃圾邮件的过滤”。这带他进入了自然语言处理的研究领域。

本科毕业之后,他通过研究生推免来到了哈尔滨工业大学(深圳)继续硕士学业,师从王晓龙教授。王老师是中文信息处理领域的资深专家,微软拼音输入法的创始人。研究生阶段,忠钰主要参与的课题是金融文本的语义理解,希望可以通过机器学习的方法自动判断金融新闻的相关性以及重要程度。在实验室博士师兄的指导和帮助下,他在研一期间便撰写了一篇英文论文,并成功发表。初战告捷燃起了他做科研的信心,而研究过程中收获的快乐,也让他产生了继续深造的想法。

哈工大的硕士学制是两年半,研一结束就得考虑下一步打算。那时(2008年)互联网行业开始蓬勃发展,薪资水平增长很快。但忠钰对于进入业界总是提不起兴趣,继续求学、去看看更大的世界对他来说更有吸引力。因为地缘关系,他收集到了一些香港院校的信息,并开始着手准备博士申请。研二下,幸运之神再次眷顾了忠钰,他拿到了香港中文大学的录取通知书。王晓龙老师非常支持他继续求学,并同意他提前半年毕业。

这样2010年8月魏忠钰入学香港中文大学工学院系统工程管理系,师从黄锦辉教授。

从“菜鸟”到Dr. Wei

在社会媒体处理领域渐入佳境

忠钰的导师黄锦辉教授主要研究方向是社会媒体处理,研究的大方向敏感度较高。黄老师在亚洲区率先跟进情感计算的相关课题研究,并在2011年时撰写了“社交媒体谣言检测”的研究企划,获得香港政府研究基金(RCG)资助。相比于手把手指导学术过程,黄老师更习惯指定一个方向,让学生去自由探索。

这样的风格,给忠钰的起步阶段带来了不小的挑战。在博士一二年级,忠钰主要聚焦社交媒体内容分析的相关课题,虽然做了一些工作,但文章并未得到发表。回想起来,忠钰觉得:相比于起步顺利,这种带有挫折的起步,让他对学术更有一种敬畏之心,可以走得更远。

学术发表的转折点发生在2012年。2011年暑假,在英国任教的何瑜岚老师来课题组访问,并开始具体指导忠钰的科研工作,课题是关于使用社交媒体信息预测英国大选的结果。何老师返回英国之后依旧和忠钰保持远程的学术讨论,并在2012年上半年邀请忠钰去英国开放大学知识媒体研究中心(KMI)访问。

在访问期间,他们推动与开放大学教育学院的合作:基于线上课堂的讨论文本评估学生的学习效果。这两篇与何老师合作的论文让忠钰的博士生涯“开张”了。“这段经历也让我了解交叉学科的研究,能接触到不同的问题和不同领域的学者,很有意思。”

2012年受邀到英国访问

除了英国之外,忠钰还在卡塔尔计算研究中心(QCRI)有过半年(2013年6月到12月)的访问经历,接受高巍老师的指导。高老师与忠钰同属一个师门,在忠钰刚入学时,就参与指导过他的研究课题。QCRI在自然语言处理(NLP)领域小有名气,聚集了学术界一批优秀的研究者,并吸引了不少知名高校的学生前来访问。

在这个社群中,忠钰结识了一批来自美国的同行学生。交流过程中,忠钰发现他们选择的课题有更高的丰富度,技术框架也更具前沿性,遂产生了去美国进一步深造的想法。

这两段研究经历锻炼了忠钰的学术能力,也让他在研究上的推进顺利了不少。在谣言检测方面,他提出针对社交媒体信息进行不确定度的判定,并独立完成了方法和实验的设计以及论文的撰写。该论文也被自然语言处理顶级会议——计算语言学协会年度会议(ACL2013)——录取。

在QCRI 访学过程中,忠钰针对使用社交媒体信息辅助新闻摘要的工作也被自然语言处理的著名会议国际计算语言学会议(COLING 2014)录取。这样,忠钰积攒了足够的学术发表,并在2014年上半年开始博士论文“结合社交媒体信息的新闻摘要方法研究”的撰写,于2014年8月18日顺利通过了博士答辩。

博士阶段于我而言,不仅仅是学术提升的旅程,更重要的是,我接触到了不同的文化(中国香港、英国、中东)。这个过程帮我更清楚地了解自己,也坚定了我继续探索学术研究的决心。

UTD博后研究

转向计算论辩新方向

博士论文完成后,忠钰就开始寻求去美国深造的机会。恰逢得克萨斯大学达拉斯分校(UTD)自然语言处理组的刘扬老师招博士后。刘老师是自然语言处理领域国际知名的学者,在文本摘要方面做出过很有影响力的工作。忠钰投了简历后很快得到回音,遂于当年12月去UTD开启了博后工作。

博后期间,忠钰主要推进社交媒体评论分析的相关研究,希望挖掘互联网上民众对一些社会话题的立场和看法,合作团队包括哥伦比亚和华盛顿大学的课题组。针对公共议题的讨论,往往涉及逻辑表达,这让忠钰关注到了一个新的学术方向——计算论辩。

论辩(Argumentation)旨在研究人们在语言、文本中蕴含的逻辑论证过程,是一项涉及语言学、哲学、修辞学、逻辑学等多门交叉学科的研究领域。计算论辩学试图将人类关于逻辑论证的认知模型与机器自动化的计算模型结合起来,以赋予人工智能系统理解人类辩论推理过程的能力。2014年计算论辩还未引起广泛关注,当年有一个论辩挖掘的国际学术研讨会,由欧美学者共同发起。

2015年忠钰在丹佛参加了论辩挖掘的第二届研讨会(Argmine 2015),马上引起了他浓厚的兴趣,认为由此可深入理解文本中的深层次逻辑关系,这种逻辑关系的梳理不仅对自然语言处理至关重要,而且会对教育领域的论文撰写、司法领域的法律文书理解带来一系列变革。

2015年下半年,忠钰在社交媒体评论分析基础上提出“社交媒体上文本说服力评价”的研究课题,并撰写论文投到ACL2016,获得录取。这是首批针对社交媒体文本做说服力评价方面的工作。8年后再谈到此事,魏忠钰认为这件事对于他的成长而言,是从老师指导方向做研究转向独立发现研究点并开展研究的转折:

论辩挖掘就是我自发选择的方向,也是迄今我一直在坚持的方向。尽管论辩挖掘目前还不是非常热门,但我相信它的发展潜力还在慢慢释放,我也会致力于推进中文社区的论辩研究的进展。

缘定复旦,主推数字化社会治理

让人工智能拥抱全社会

在达拉斯分校逗留了一年半后,魏忠钰决定回国。2016年初听说新成立的复旦大学大数据学院要招收计算机背景的老师,忠钰遂递交了申请书。刚好大数据学院对自然语言处理的相关方向感兴趣,对他的研究背景也比较认可。2016年5月他拿到复旦大学大数据学院聘其为青年副研究员的通知,并在同年8月加入复旦,成为大数据学院第三位入职的青年教师。

打开网易新闻 查看更多图片

2019年在清华做计算论辩学术报告

魏忠钰在大数据学院领导一个名为数据智能与社会计算的课题组,主要推进的方向是数字社会治理,希望使用自然语言处理技术赋能社会治理。数字社会治理面向的场景多样,包括智能医疗、智慧金融、数字政府等,每一个场景下都有很多需要解决的任务(比如用户建模,文本分析),以往的机器学习方法,往往只面向某个特定的任务,完成数据集构建、算法设计、模型训练这一自动化流程,相同的模型不能复用到其他任务,更遑论其他领域了,所以每每有新的问题出来时,就需要重新把这个过程走一遍,繁琐且有大量重复工作。

目前,他的团队正在探索面向数字社会治理的跨场景数据融合、多任务泛化训练、智能交互学习的三阶段研究范式,将数字社会治理的多个场景的数据(序列化数据、图数据)进行融合,研究混合数据类型的自监督学习方法,推进数字社会治理大模型的研究工作。“这样的一套技术路径很有可能在未来取得突破。”

教学、科研、人才培养

做好一个大学教师的三件事

谈起大学老师这个工作,忠钰开始兴奋起来。他认为,想成为一个优秀的大学老师,需要兼顾教学、科研和人才培养三个方面,要不断磨炼相关的基础技能。“我很感谢在复旦的这段工作经历。跟优秀的学生一起探讨科研问题,撰写学术论文,推进科研项目,我收获了很多快乐。也希望可以在成为一个优秀的大学老师的道路上不断精进。”谈到这段工作经历,他说道。

在魏忠钰眼里,科研是一件很有趣的事情。

它严谨又要求变化和创造,它复杂但需有积累可持续,它需要你独立思考但又能带来最不受限的交流自由。这是个资讯爆炸的时代,我们常常在信息的海洋中迷失。而科研训练让我们容纳多方观点,并从中形成自己的独立思考,这正是这个时代亟需的个人品质。

他认为学术能力的提升,其实包含很多具体的方面,比如总结、写作、深度思考等。只有不断锤炼这些能力,才有可能在学术道路上不断做出有影响力的工作。

2021年实验室聚会

在加入复旦之前,忠钰并没有讲课的经验。但作为一个学生时代的文娱积极分子,在台上说话是他喜欢的活动。所以,对于初上讲台,他是充满期待的。但没想到,对讲好一门课来说,说话是最不重要的部分,核心是熟悉课程内容、准备课程讲义、撰写上课的全字稿。

在2017年春季学期,他每周要花3~4个整天来备课,而上课前的那一个晚上,熬到天亮也时常发生。这对于有科研压力的“青椒”来说,真的是一段痛苦的回忆。“现在好多了,我可以在台上从容面对学生,并且开始探索板书、视频还有作业设计这样的教学设计。”

据笔者了解,忠钰从2017年开始在大数据学院开设《人工智能》课程。该课程获得2018年复旦-谷歌创新创业课程项目和2020年教育部产学合作协同育人项目的支持,并被列入2020年复旦大学特色在线课程建设计划,获得2022年上海市重点建设课程项目。

目前,课程的视频录制工作已经完成,在疫情期间的线上教学过程中发挥了重要作用。魏忠钰也获得2021年复旦大学青年教师教学竞赛一等奖和2022年上海市青年教师教学比赛的优秀奖。

忠钰侃侃而谈,我似也有入局之感。忠钰觉得做大学老师这件事也可以理解为某种游戏,一旦做了大学老师,就相当于入了局。对大学老师而言最主要三件事:学术研究、人才培养和教学。这三件事都有其客观存在的金标准。

金标准以外的现实世界中人为设定的评价,如各种帽子都需要被更辩证地看待,不应该盲目跟随:在做大学老师这个游戏时,你把金标准要求的三件事做好了才能成为自己和人们心目中的杰出教授。如果眼里只有时下流行的东西,你或许会赢得一时的热闹,但不一定会在做杰出教授这条道路上积淀下好的东西。

享受单纯的技艺精进带来的乐趣

本文开头一段笔者提到在这位被访星友的书橱里看到灌篮高手几位主角的漫画人物造型。采访近尾声笔者又把话题引向此。忠钰先给我看了他去年10月获得的国家体育总局颁发的健身教练从业资格证:

“这可是一个正规的考试呢,我可以去当健身教练的。我自己的体育强项是跑步和足球,曾参加过两次全程马拉松(4小时以内跑完42.195公里),在国家体育测试标准中全马跑进4小时就算是国家三级运动员。灌篮高手这组人物卡通是我们组里学生送给我的生日礼物。他们知道我喜欢什么。这部同名动画我初中时就风靡全国,篮球界内外都看得热血沸腾。灌篮高手的核心在于这批年轻人凭借单纯的喜爱付出了非常人的努力,一点一点取得进步,最终将篮球视为终身热爱。这样一种追求纯粹的技能精进,如跑步跑得更快,舞台上的表现更专业,享受单纯的技艺精进带来乐趣的人生其实很值得我们仿效。”

2015年在美国达拉斯参加马拉松比赛

是的,我要为魏忠钰的那一句“最终将篮球视为终身热爱”拍手叫好!包括本期启明星专访对象魏忠钰星友在内的很多受人尊敬者都是因为视职业、视事业为终身热爱,不断追求技艺精进,才达到一定的人生高度。在崇尚专业、追求卓越的今天,我们更宜提倡这种享受单纯的技艺精进带来乐趣的人生态度。

-本文选自《世界科学》杂志2023年第5期“今日启明星”栏目-