Talk预告｜NUS余昭辰&PKU张子翔：大模型推理与多模态扩散模型的协同作用

本期为TechBeat人工智能社区第641期线上Talk。

北京时间11月21日(周四)20:00，新加坡国立大学硕士生余昭辰&北京大学硕士生张子翔的Talk将准时在TechBeat人工智能社区开播！

他们与大家分享的主题是:“大模型推理与多模态扩散模型的协同作用”，届时他们将分享课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果，以及如何与扩散模型协同生成多物体三维场景的创新方法。

Talk·信息

主题：大模型推理与多模态扩散模型的协同作用

嘉宾：新加坡国立大学 · 硕士生 - 余昭辰 & 北京大学 · 硕士生 - 张子翔

时间：北京时间11月21日(周四)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

近年来，大语言模型（LLMs）如GPT-4、PaLM和LLaMA在各种推理任务中展现了令人惊叹的性能。然而，尽管这些模型在规模和性能上不断提升，它们在处理复杂推理任务时仍面临一定的挑战。

本次讲座将介绍我们课题组在优化大语言模型处理复杂推理任务能力上的最新研究成果，以及如何与扩散模型协同生成多物体三维场景的创新方法。

Talk大纲

1.增强大语言模型推理的思维缓存方法--Buffer of Thought

2.提升大语言模型推理及纠错能力的跨模型微调框架--SuperCorrect

3.大语言模型和扩散模型协同生成多物体3D场景--Semantic-SDS

Talk·预习资料

论文链接： https://arxiv.org/abs/2406.04271 项目主页： https://github.com/YangLing0818/buffer-of-thought-llm

论文链接： https://arxiv.org/abs/2410.09008 项目主页： https://github.com/YangLing0818/SuperCorrect-llm

论文链接： https://arxiv.org/abs/2410.09009 项目主页： https://github.com/YangLing0818/SemanticSDS-3D

Talk·提问交流

在Talk界面下的【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

余昭辰‍‍‍‍‍‍‍‍‍

新加坡国立大学 ·硕士生

余昭辰，本科毕业于北京理工大学，新加坡国立大学硕士在读，北京大学数据与智能实验室（PKU-DAIR）实习生，研究方向为扩散模型与大模型，已在ICLR、ICML、NeurIPS 等顶会上一作发表多篇论文，担任NeurIPS，ICLR, AISTATS等顶会审稿人。

个人主页: https://www.techbeat.net/grzytrkj?id=4=38118

张子翔

北京大学 ·硕士生

张子翔，2025年入学的北京大学硕士研究生，本科就读于北京理工大学，专业成绩排名第一，两次获得国家奖学金；主要关注扩散模型、可控视觉生成、可控3D生成等领域。

个人主页: https://www.techbeat.net/grzytrkj?id=42594

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择！

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投，是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>

预约本期Talk

Talk预告｜NUS余昭辰&PKU张子翔：大模型推理与多模态扩散模型的协同作用

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

沈向洋，发了一个可以识别万物的大模型

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

第一个被人类骗钱的AI傻了，近5万美元不翼而飞！Scaling Law还能带我们到AGI吗？

用 AI 复制你的个性，两个小时就够了

OpenAI加速扩张：与苹果合作、推AI Agent，锁定10亿用户目标！

大模型可视化工具爆火，GPT推理过程一目了然

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

如果谋杀方式有段位的话！那么这，绝对是王者级别的！推理

如何在千里之外实施谋杀？这个凶手给出了完美答案！推理

常州坠湖直升飞机失事前视频低空掠过一片露营地

情节反转不断！结局意想不到！究竟是谁杀了这个可怜的女孩？推理

碎语｜不懂逻辑，就会常常犯错

十问CPU做AI推理，伪命题还是真需求？

带你沉浸式体验这部2024你不能错过的剧本啥电影！推理

超低门槛用AI，你的企业和大模型之间只差这三大法宝

Talk预告｜NUS余昭辰&PKU张子翔：大模型推理与多模态扩散模型的协同作用

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

沈向洋，发了一个可以识别万物的大模型

AI做数学学会「动脑子」！ UCL等发现LLM「程序性知识」，推理绝不是背答案

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

第一个被人类骗钱的AI傻了，近5万美元不翼而飞！Scaling Law还能带我们到AGI吗？

用 AI 复制你的个性，两个小时就够了

OpenAI加速扩张：与苹果合作、推AI Agent，锁定10亿用户目标！

大模型可视化工具爆火，GPT推理过程一目了然

几行乱码让大模型获得科学思维，这个神奇的提示词突然火了

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

如果谋杀方式有段位的话！那么这，绝对是王者级别的！推理

如何在千里之外实施谋杀？这个凶手给出了完美答案！推理

常州坠湖直升飞机失事前视频 低空掠过一片露营地

情节反转不断！结局意想不到！究竟是谁杀了这个可怜的女孩？推理

碎语｜不懂逻辑，就会常常犯错

十问CPU做AI推理，伪命题还是真需求？

带你沉浸式体验这部2024你不能错过的剧本啥电影！推理

超低门槛用AI，你的企业和大模型之间只差这三大法宝

常州坠湖直升飞机失事前视频低空掠过一片露营地