打开网易新闻 查看更多图片

本期为TechBeat人工智能社区596线上Talk。

北京时间5月30日(周四)20:00,香港中文大学博士生赖昕的Talk将准时在TechBeat人工智能社区开播!

他与大家分享的主题是:LISA - 推理分割新范式,届时将向大家介绍一种新的多模态大模型——LISA模型,它能够赋予多模态大模型输出更加精细的图像分割Mask的能力。最终该模型能够有效解决涉及复杂逻辑推理(推理分割)问题。该工作已入选CVPR 2024 Oral。

Talk·信息

主题:LISA - 推理分割新范式

嘉宾:香港中文大学博士生 赖昕

时间:北京时间5月30日(周四)20:00

地点:TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

目前开源多模态大语言模型层出不穷,展现出了强大的多模态推理能力,例如Mini-GPT4, LLaVA。然而,它们只能够输出文本形式的回复,这大大限制了多模态大模型在现实生产生活中的应用潜力。作为一个开始,我们提出LISA模型,赋予多模态大模型输出更加精细的图像分割Mask的能力。最终该模型能够有效解决涉及复杂逻辑推理(推理分割)问题。

Talk大纲

1. 背景和动机:传统的语言和图像分割结合方式的缺陷;

2. 新的任务——推理分割;

3. 我们的方法——模型,数据以及训练方式;

4. 实验部分。

Talk·预习资料

打开网易新闻 查看更多图片

论文链接: https://arxiv.org/abs/2308.00692

代码链接: https://github.com/dvlab-research/LISA

Talk·提问交流

在Talk界面下的【交流区】参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

打开网易新闻 查看更多图片

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

打开网易新闻 查看更多图片

赖昕

香港中文大学 · 博士生

赖昕,就读于香港中文大学的四年级博士生,师从贾佳亚教授。研究兴趣包括多模态大模型,长链条推理以及3D Transformer。目前已发表6篇一作顶会论文,其中代表工作包括LISA和Stratified Transformer。

个人主页: https://www.techbeat.net/grzytrkj?id=31521

-The End-

打开网易新闻 查看更多图片

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择!

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>

预约本期Talk