不做数值运算、纯靠嘴炮也能机器学习？基于自然语言的全新ML范式

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@jiqizhixin.com；zhaoyunfeng@jiqizhixin.com

本文作者肖镇中是德国马克思普朗克-智能系统研究所和图宾根大学的博士生，Robert Bamler 是图宾根大学机器学习方向的教授，Bernhard Schölkopf 是马克思普朗克-智能系统研究所的所长，刘威杨是马普所剑桥大学联合项目的研究员。

论文地址：
https://arxiv.org/abs/2406.04344

图 1：VML 的训练算法。

图 2：VML 中模型和优化器的自然语言模版样例。

图 3: VML 在多项式回归任务中的训练过程记录。

非线性二维平面分类

仔细观察第五十步后的模型参数，我们可以看到加了归纳偏置的模型描述中包含了很多与肺炎相关的医学词汇，比如「感染」、「发炎」；而没有加归纳偏置的模型描述中只有对肺部 X 光片的特征描述，比如「透明度」、「对称」。

同时，这些模型所学到的描述，都是可以被具备专业知识的医生验证的。这种可解释和人工检验的机器学习模型在以安全为重的医疗场景下十分有价值。

图 5: VML 在 PneumoniaMNIST 图片二分类上的训练记录。

结语

该文章介绍了一种基于大语言模型的机器学习新范式 Verbalized Machine Learning (VML; 言语化的机器学习)，并在回归和分类任务上展示了 VML 的有效性和可解释性的特点。

不做数值运算、纯靠嘴炮也能机器学习？基于自然语言的全新ML范式

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

Jeff Dean亲授职业秘籍，力荐计算机！编码改变全世界

依靠群体的力量：这家公司走出了一条不同于OpenAI的AGI路线

AI三重劫

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

大疆前高管带6人创业，做出了类目Top1的割草机器人

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

医学预测模型方法这么多，我该选择哪一个？

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

非如此不可？非如此不可——纪念顾准

德国伟大的哲学家黑格尔：为何说中国无真正的历史，只是朝代轮回

姜萍与天才

员工利用工具，将披萨均匀切割开，“能用工具就绝不直接用手”

普通人现实的选择：要工作岗位，还是要剥削论？

马斯克称脑机接口能解决大多数疾病，大规模量产后成本将与手机相当

奥特曼最新采访：AGI将在2025年到来！

不做数值运算、纯靠嘴炮也能机器学习？基于自然语言的全新ML范式

Hinton揭秘Ilya成长历程：Scaling Law是他学生时代就有的直觉

「LLM」这个名字不好，Karpathy认为不准确、马斯克怒批太愚蠢

Jeff Dean亲授职业秘籍，力荐计算机！编码改变全世界

依靠群体的力量：这家公司走出了一条不同于OpenAI的AGI路线

AI三重劫

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

大疆前高管带6人创业，做出了类目Top1的割草机器人

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

1000多个智能体组成，AI社会模拟器MATRIX-Gen助力大模型自我进化

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

医学预测模型方法这么多，我该选择哪一个？

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

非如此不可？非如此不可——纪念顾准

德国伟大的哲学家黑格尔：为何说中国无真正的历史，只是朝代轮回

姜萍与天才

员工利用工具，将披萨均匀切割开，“能用工具 就绝不直接用手”

普通人现实的选择：要工作岗位，还是要剥削论？

马斯克称脑机接口能解决大多数疾病，大规模量产后成本将与手机相当

奥特曼最新采访：AGI将在2025年到来！

员工利用工具，将披萨均匀切割开，“能用工具就绝不直接用手”