学术写作通常以难以理解而著称,但如果您可以使用机器学习来总结科学论文中的论点,这样即使是 7 岁的孩子也能理解它们呢?这就是tl;dr 论文背后的想法——一个利用 AI 语言处理的最新进展来简化科学的项目。

Dani 告诉The Verge,两年前大学朋友 Yash Dani 和 Cindy Wu 开始在该网站上工作,作为“了解更多关于软件开发的知识” ,但该服务于周末在 Twitter 上传播开来,当时学者们开始分享人工智能摘要他们的研究。AI 生成的结果有时不准确或简化到白痴的程度。但同样经常,他们令人满意且令人惊讶的简洁,通过学术术语来传达可能被误认为是孩子般的智慧的东西。

以澳大利亚国立大学全球女性领导力研究所所长 Michelle Ryan 教授的论文摘要为例。瑞安曾写过“玻璃悬崖”的概念,这是一种性别歧视形式,在机构面临最大失败风险的时候,女性被置于领导角色。她工作的人工智能总结?“玻璃悬崖是很多女性被安置的地方。这是一个糟糕的地方。”

正如瑞恩所说,“这真是太棒了”。

Ryan 告诉The Verge,这个总结是“准确而简洁的”,尽管它确实忽略了这个概念的很多细微差别。在某种程度上,这是因为一个关键的警告:tl;博士论文只分析科学论文的摘要,这本身就是研究人员论点的浓缩版本。(能够浓缩整篇论文将是一个更大的挑战,尽管这是机器学习研究人员已经在研究的东西。)

Ryan 说,尽管 tl;dr 论文无疑是一个非常有趣的工具,但它也提供了“一个很好的例证,说明了良好的科学传播应该是什么样子”。“我认为我们中的许多人都可以用一种对读者更友好的方式来写作,”她说。“而二年级学生的目标受众是一个很好的起点。”

宾夕法尼亚大学安纳伯格传播学院的博士生 Zane Griffin Talley Cooper 将 AI 总结描述为“令人耳目一新的透明”。他利用该网站浓缩了一篇关于“数据外围”的论文,该论文追溯了对大数据基础设施至关重要的材料的物理历史。或者,正如 tl;博士论文所说:

Cooper 说,尽管该工具是“表面上的玩笑”,但像这样的系统可能会在教学和学习中具有重要的应用。人工智能摘要器可以被学生用作复杂论文的一种方式,或者它们可以被整合到在线期刊中,自动生成简化的摘要供公众使用。“当然,”库珀说,只有“如果框架得当,并讨论限制以及使用机器学习作为写作工具的意义(无论是在实践上还是在道德上),才应该这样做。”

人工智能语言工具已被整合到微软和谷歌的软件中

制造这些人工智能系统的公司仍在探索这些限制,即使该软件被整合到越来越主流的工具中。tl;博士论文本身是在 GPT-3 上运行的,这是最著名的 AI 写作工具之一,由 OpenAI 制作,OpenAI 是一家与微软密切合作的联合研究实验室和商业初创公司。

微软已经使用 GPT-3 及其同类产品来构建工具,例如用于编码人员的自动完成软件,并且最近开始为企业提供对该系统的访问权限,作为其云套件的一部分。该公司表示,GPT-3 可用于分析文本的情绪,为企业产生想法,并且——是的——压缩文件,如会议记录或电子邮件交流。而且,类似于 GPT-3 的工具已经被用于谷歌的 Gmail 和 Docs 等流行服务,这些服务为用户提供人工智能驱动的自动完成功能。

但是这些人工智能语言系统的部署是有争议的。一次又一次地表明,这些工具会根据它们的训练数据(通常只是从互联网上抓取的大量文本)对有害语言进行编码和放大。他们重复种族主义和性别歧视的刻板印象和诽谤,也可能以更微妙的方式存在偏见。

打开网易新闻 查看更多图片

一系列不同的担忧源于这些系统的不准确性。这些工具仅在统计级别上操纵语言:它们对“阅读”的内容没有与人类同等的理解,这可能会导致一些非常基本的错误。在去年浮出水面的一个臭名昭著的例子中,谷歌搜索——它使用人工智能来总结搜索主题——为询问如果有人癫痫发作该怎么办的查询提供了误导性的医疗建议。去年 12 月,亚马逊的 Alexa 回应了一个孩子的要求,要求他们做一个有趣的挑战,告诉他们用一分钱触摸插头暴露在外的插脚。

这些情景对生命造成的具体危险是不寻常的,但它们生动地说明了这些模型的结构弱点。莫纳什大学新兴技术研究实验室的高级研究员 Jathan Sadowski 是另一位被 tl;dr 论文的研究总结所吸引的学者。他说像这样的人工智能系统应该小心处理,但它们可以在正确的环境中发挥作用。

“也许有一天 [这项技术] 会变得如此复杂,以至于这个自动化研究助理会在你睡觉时为你提供完美、准确、高质量的学术文献注释书目。但我们现在离那个点还很远,”萨多夫斯基告诉The Verge。“该工具真正的、直接的用处——首先是——作为一个新奇事物和玩笑。但更实际地,我可以将其视为创造力的催化剂。一些东西让你对你的工作产生了这种陌生的视角。”

“我可以将其视为创造力的催化剂。一些东西让你对你的工作产生了这种陌生的视角。”

Sadowski 说,tl;dr 论文提供的摘要通常对他们有一种“偶然的智慧”——也许是机器学习无法完全理解语言的副产品。在其他情况下,艺术家们使用这些人工智能工具来写书和写音乐,Sadowski 说机器的视角可能对那些在他们的学科中钻得太深的学者有用。“它可以让你与一个你花了很多时间真正接近的东西保持人为的距离,这样你就可以从不同的角度看待它,”他说。

通过这种方式,像 tl;dr 论文这样的 AI 系统甚至可能会找到一个类似于旨在促进创造力的工具的地方。以“Oblique Strategies”为例,这是由 Brian Eno 和 Peter Schmidt 创建的一副纸牌。它为苦苦挣扎的艺术家提供了精辟的建议,例如“问问你的身体”或“试着伪装它!” 这些智慧之言是否充满了深刻的智慧?也许,也许不是。但它们的主要作用是激发读者进入新的思维模式。人工智能可以提供类似的服务,事实上,一些公司已经在销售人工智能创意写作助手。

不幸的是,尽管 tl;dr 论文在学术界受到热烈欢迎,但它在聚光灯下的时间似乎有限。在本周末病毒式传播后,该网站已被标记为“正在维护”,该网站的创建者表示他们没有计划在未来维护它。(他们还提到已经构建了执行相同任务的其他工具。)

Dani 告诉The Verge,tl;dr 论文“被设计成一个实验,看看我们是否可以让学习科学变得更容易、更有趣、更有吸引力。” 他说:“我感谢该应用程序收到的所有关注,并感谢所有尝试过它的人 [but] 鉴于这一直是一个教育项目,我计划在未来停止 tl;dr 论文几天专注于探索新事物。”