本期为TechBeat人工智能社区第596期线上Talk。
北京时间5月30日(周四)20:00,香港中文大学博士生赖昕的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是:“LISA - 推理分割新范式”,届时将向大家介绍一种新的多模态大模型——LISA模型,它能够赋予多模态大模型输出更加精细的图像分割Mask的能力。最终该模型能够有效解决涉及复杂逻辑推理(推理分割)问题。该工作已入选CVPR 2024 Oral。
Talk·信息
主题:LISA - 推理分割新范式
嘉宾:香港中文大学博士生 赖昕
时间:北京时间5月30日(周四)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
Talk·介绍
目前开源多模态大语言模型层出不穷,展现出了强大的多模态推理能力,例如Mini-GPT4, LLaVA。然而,它们只能够输出文本形式的回复,这大大限制了多模态大模型在现实生产生活中的应用潜力。作为一个开始,我们提出LISA模型,赋予多模态大模型输出更加精细的图像分割Mask的能力。最终该模型能够有效解决涉及复杂逻辑推理(推理分割)问题。
Talk大纲
1. 背景和动机:传统的语言和图像分割结合方式的缺陷;
2. 新的任务——推理分割;
3. 我们的方法——模型,数据以及训练方式;
4. 实验部分。
Talk·预习资料
论文链接: https://arxiv.org/abs/2308.00692
代码链接: https://github.com/dvlab-research/LISA
Talk·提问交流
在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!
你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!
Talk·嘉宾介绍
赖昕
香港中文大学 · 博士生
赖昕,就读于香港中文大学的四年级博士生,师从贾佳亚教授。研究兴趣包括多模态大模型,长链条推理以及3D Transformer。目前已发表6篇一作顶会论文,其中代表工作包括LISA和Stratified Transformer。
个人主页: https://www.techbeat.net/grzytrkj?id=31521
-The End-
如果你也想成为讲者
自荐 / 推荐
单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>
预约本期Talk

