Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

本期为TechBeat人工智能社区第639期线上Talk。

北京时间11月14日(周四)20:00，德克萨斯大学奥斯汀分校博士生樊志文的Talk将准时在TechBeat人工智能社区开播！

他与大家分享的主题是:“端到端从多视角图片解析3D与全景3D生成”，届时他将分享三篇3D重建以及一篇3D生成模型的工作，其中三篇均收录于NeurIPS'24和ECCV’24。

Talk·信息

主题：端到端从多视角图片解析3D与全景3D生成

嘉宾：德克萨斯大学奥斯汀分校 · 博士生 - 樊志文

时间：北京时间11月14日(周四)20:00

地点：TechBeat人工智能社区

http://www.techbeat.net/

Talk·介绍

用互联网级数据训练的Large Foundation Model在改变我们的工作方式和解决复杂问题上展现了很大潜力。不过，像LLM和VLM这样的模型虽然能解读文本或单张图像，但在现有的多模态训练框架下，对空间关系的理解还存在挑战。未来的智能AI系统要能够理解3D环境的结构，才能可靠地与物理世界交互，这是实现自主系统的关键。

然而目前的3D重建流程还是依赖于模块化、non-differentiable的处理系统，难以进行大规模训练。在生成式AI，元宇宙应用里使用全景图可以提供沉浸式的体验，如何通过文字或者单张全景图来生成3D和4D全景图未曾解决。

本次talk将分享三篇3D重建以及一篇3D生成模型的工作，其中三篇均收录于NeurIPS'24和ECCV’24。

Talk大纲

1. InstantSplat 从稀疏视角图像以秒级重建3D

2. LightGaussian 压缩3D-GS超过15倍并且提升渲染速度超50%

3. LargeSpatialModel 端到端的3D语义重建框架

4. DreamScene360 文字到3D全景图生成

Talk·预习资料

论文链接： https://arxiv.org/abs/2403.20309 项目主页： https://instantsplat.github.io/

论文链接： https://arxiv.org/abs/2311.17245 项目主页： https://lightgaussian.github.io/

论文链接： https://arxiv.org/abs/2410.18956 项目主页： https://largespatialmodel.github.io/

论文链接： https://arxiv.org/abs/2404.06903 项目主页： https://dreamscene360.github.io/

Talk·提问交流

在Talk界面下的【交流区】参与互动！留下你的打call和问题，和更多小伙伴们共同讨论，被讲者直接翻牌解答！

你的每一次贡献，我们都会给予你相应的i豆积分，还会有惊喜奖励哦！

Talk·嘉宾介绍

樊志文‍‍‍‍‍‍‍‍‍

德克萨斯大学奥斯汀分校 · 博士生

樊志文是德克萨斯大学奥斯汀分校的Ph.D Candidate，其导师为Zhangyang "Atlas" Wang教授。他在2022年获得了高通创新奖学金资助，目前在Meta Core AI担任研究实习生，致力于3D Foundation Model的开发。樊志文还曾在NVIDIA和Google实习，并曾任职于阿里巴巴集团，担任高级研究工程师。

个人主页: https://www.techbeat.net/grzytrkj?id=42447

-The End-

如果你也想成为讲者

自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流

多种方式任你选择！

推荐讲者成功也有奖励哦~

关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投，是一个荟聚全球华人AI精英的成长社区。

我们希望为AI人才打造更专业的服务和体验，加速并陪伴其学习成长。

期待这里可以成为你学习AI前沿知识的高地，分享自己最新工作的沃土，在AI进阶之路上的升级打怪的根据地！

更多详细介绍>>

预约本期Talk

Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

字节AI版小李子一开口：黄风岭，八百里

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

阿里推出AI数据科学家，全流程自动化，科研小白也能用

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐全自动化

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

美国6大科技公司市值暴涨8万亿美元！ChatGPT推出两周年，大公司更强了

2024宪法宣传周 | 三中全会《决定》里的未来全景图

水果批发市场一店主直呼今年生意太难了，生意难做钱难挣

爷爷奶奶没见过屋后山的全貌，孙子用无人机拍下老家大山全景，网友：这一刻的意义无价

《刀郎厦门演唱会》凤凰体育馆全景

韩国教授警告：全世界只有韩国看不起中国，韩国人是怎么了？

人工智能对战顶级强软，走出高深莫测的布局飞刀，你值得拥有

物业半夜不准业主出小区业主出门被推搡还遭斥：别说话

当人工智能有了自我意识，做的第一件事就是报复邻居！惊悚片

福建舰传来好消息！最新卫星图像曝光，中国电弹时代到来？

吴恩达开源Python包，统一11家顶尖大模型平台接口

女游客用饼干喂鹿被日本网红训斥前者连说：I'm sorry

Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

字节AI版小李子一开口：黄风岭，八百里

抢疯了，腾讯给大模型人才，定了一个前所未有的标准

大模型承重墙，去掉了就开始摆烂！苹果给出了「超级权重」

阿里推出AI数据科学家，全流程自动化，科研小白也能用

AI被连续否定30次：ChatGPT越改越错，Claude坚持自我、已读不回

摒弃人工标注，AutoAlign方法基于大模型让知识图谱对齐全自动化

字节大模型同传智能体，一出手就是媲美人类的同声传译水平

8岁小孩哥上手用AI制作游戏，全程2小时，引来50多万人围观

美国6大科技公司市值暴涨8万亿美元！ChatGPT推出两周年，大公司更强了

2024宪法宣传周 | 三中全会《决定》里的未来全景图

水果批发市场一店主直呼今年生意太难了，生意难做钱难挣

爷爷奶奶没见过屋后山的全貌，孙子用无人机拍下老家大山全景，网友：这一刻的意义无价

《刀郎厦门演唱会》凤凰体育馆全景

韩国教授警告：全世界只有韩国看不起中国，韩国人是怎么了？

人工智能对战顶级强软，走出高深莫测的布局飞刀，你值得拥有

物业半夜不准业主出小区 业主出门被推搡还遭斥：别说话

当人工智能有了自我意识，做的第一件事就是报复邻居！惊悚片

福建舰传来好消息！最新卫星图像曝光，中国电弹时代到来？

吴恩达开源Python包，统一11家顶尖大模型平台接口

女游客用饼干喂鹿被日本网红训斥 前者连说：I'm sorry

物业半夜不准业主出小区业主出门被推搡还遭斥：别说话

女游客用饼干喂鹿被日本网红训斥前者连说：I'm sorry