西湖大学首届本科生张乐程,他作为共同第一作者的论文《理解和克服深度模型在分子属性预测任务上的局限性》,成功被NeurIPS大会录用。

这个大会昨天开始,在美国举办。NeurIPS大会全称是神经信息处理系统大会,聚焦于深度学习、计算机视觉、大规模机器学习、学习理论等方面,是人工智能领域的顶级学术会议之一,在全球包括Nature、Science在内的所有科技文献中排名第9。

这届会议共收到12343 篇论文投稿,26.1%的文章被录用,其中西湖大学有9篇论文入选,分别来自工学院人工智能方向的李子青实验室、王东林实验室、张岳实验室,张乐程的论文也在其中。按投稿时间(今年春天)计算,他参与这项科研和写论文的时候还在读大一。

打开网易新闻 查看更多图片

这篇论文研究的是什么?

先来看看,张乐程研究了什么。

当前,AI已经成为辅助发现新药的重要手段,尤其在药物分子的属性预测中(如毒性、溶解度等),起到了至关重要的作用。但在实际研发和生产中却发现,高级的深度神经网络AI模型,反而不如传统模型有效,这很反常。张乐程的论文就在研究这个问题。

历时三个多月,他们搜集数据、写代码、设计了一系列实验,终于找到症结所在,并提出一种解决方法。

写了一封自荐信

成功加入实验室

张乐程成长在一个教师家庭,初中毕业保送萧山中学后,他提前半年去高中学习,在那里接触到了编程、算法及其他计算机科学方面的知识,并加入了学校的信息学竞赛队伍,数学和物理一直是他的所长。

进入西湖大学后,张乐程早早瞄准了“人工智能”方向。按照西湖的培养模式,所有本科生前两年不分专业,但学校会给每一位学生配备一名博导作为学术导师,带领他们“入门”。导师和学生有“双向选择”的权利。

作为浙江省信息学竞赛一等奖获得者,张乐程毫不犹豫地选择了西湖人工智能分支的“顶配”——讲席教授李子青。

打开网易新闻 查看更多图片

导师李子青

张乐程毛遂自荐,给李子青写了一封自荐信。最终顺利入驻实验室,在一众博士师兄师姐们的座位当中有了“一席之地”。

自荐信里写了啥?

“我是高中信息竞赛的选手,在高中阶段打了100,000+行的代码,最后获得了NOIP省一和NOI冬令营全国银牌成绩。” “我基本掌握算法导论、组合数学、离散数学,也涉猎了斯坦福大学的具体数学,也对人工智能有些许了解。” “至于数学,我涉猎了高等数学、线性代数、概率论和数理统计、数学分析等……”

李子青对张乐程的这封信印象深刻,“这是一个很优秀的学生”。虽然他从未带过本科一年级的学生,但数学好、编程好,是他对学生的基本要求,况且,张乐程才高中毕业,那一刻他觉得发现了一块璞玉。

有导师,有实验室,不缺上手的机会。张乐程用了大半年时间,一边学习机器学习的基础理论,一边参加小项目,提高深度学习的实践能力。有一天博士生师兄夏俊和他说,要不要一起来做个项目?他觉得可以,然后就加入了。

初出茅庐即首战告捷,而且是西湖首届本科生中第一个发表论文,问张乐程有什么心得可以和大家分享?他认真思考了一会儿说:“要学会积极地去沟通,而不是等着别人上门来找你。西湖大学是一座‘富矿’,能不能用好,就看你会不会主动去搜寻和获取。

常提出一些奇奇怪怪的想法

这正是西湖大学看中的“科研潜质”之一

夏俊是李子青实验室博士四年级学生,也是这篇顶会的共同一作,研究方向是“机器学习方法和其在生物医药领域的应用”。

2022年8月,他接收到导师李老师的通知,“他说决定接收张乐程了,让我教他一些入门的基础知识”。

两人在本科生书院见面了。之后的日子里,老手带新手,差不多每周要沟通一次,有线上,也有线下。夏俊常给张乐程带一些专业书,让他边看边提问,也会给他布置一些小项目上手练练。实验室每周一次的组会,只要张乐程没有课,也会来参加,不管能听懂多少。

当李子青确定启动研究AI智药那个令人费解的问题时,夏俊决定推荐实验室里最年轻的面孔作为自己的合作者,李子青也毫无意外地给予支持。

“从经验来讲,乐程肯定不如实验室里其他人,写代码的规范性要差一点,毕竟训练少,之前有很多东西还是靠自学‘野蛮生长’。”夏俊发现,张乐程经常会提出一些奇奇怪怪的问题。“他在思考,他有自己的想法。”有些问题甚至让夏俊都感到汗颜,“为什么我没想到呢?”

提问,正是西湖大学最看重的“科研潜质”之一。

“这个课题在别人眼里也许就是一个必须完成的作业,但在张乐程眼里不是,他会钻进去,认真琢磨一些事。” 夏俊相信,这位初生“牛犊”,一定会交出亮眼的成绩。

本科生α书院

导师李子青评价张乐程:少见!

在李子青的人生中,改过的论文无数。他曾任AI顶刊IEEE T-PAMI等刊物副主编,担任过100余个国际学术会议大会主席、程序主席或程序委员,迄今他自己发表的论文就超过500篇。

在学院里,他对文章以及文字的“挑剔”,众所周知。可对大一学生张乐程发AI顶会这件事,他用了“少见”两个字来评价。

李子青深知学校“200博导对应60学生”的投入和对这批年轻学生的期望。李子青说:“我所做的只不过是发掘学生的特点和潜力,鼓励他们尽早积极参与前沿科研,并创造条件让他们快速成长、成才。”

所以,张乐程的顶会论文对李子青而言,既是意外之喜,又是期待的达成。“真为他高兴。”

大二的张乐程很忙

参加面试选拔、程序设计比赛、学英语……

现在读大二的张乐程,已经忙到飞起:

他要去上海参加资助AI领域优秀本科生的奖学金的面试选拔; 他去南京和合肥参加美国计算机协会发起组织的国际大学生程序设计竞赛(ICPC)亚洲区域赛; 他还要准备托福考试,因为按照西湖的规定,下一个学年他们将出国交换学习,张乐程希望能去在计算机领域排行“数一数二”的加州大学伯克利分校,见识一下业界最厉害的“大牛”……

但即使这么忙的情况下,张乐程依旧保持另一个身份——视频博主“孙1超”

张乐程的个人主页

课余,他做了很多短视频,内容涉及学习生活的各方面,包括西湖大学本科生的录取通知书长什么样?想看看本科生的寝室吗?西湖大学超市里600ml的可乐只要2块9,是真的吗……一个个话题时不时掀起一阵小高潮。