字节跳动最新AI生成3D模型技术！

“ 感知技术 · 感触CG · 感受艺术 · 感悟心灵 ”

中国很有影响力影视特效CG动画领域自媒体

说到AI生成3D模型，虽然效果上总有些差强人意，精度方面更是有待提高；但也得承认这项技术一直都在进步着，且每次步子都迈得挺大的。

这不，才刚进9月，字节跳动就开始发大招了。字节跳动的研究团队最近推出了一款新的AI模型，能够通过文本提示生成高质量3D模型。

这款名为MVDream的多视角扩散模型，可以根据任意给定的文本提示生成物体/场景的多视角图像。

通过利用在大规模Web数据集和从3D资产中渲染的多视角数据集上预先训练的图像扩散模型，由此产生的多视角扩散模型同时结合了2D扩散模型的适应性和3D数据的一致性。

因此，该模型可以通过分数蒸馏采样为3D生成内容提供有价值的多视角参考，通过解决3D一致性问题极大地提高了现有2D提升方法的稳定性。

此外，该研究团队还指出，MVDream可以在极少样本的情况下进行微调，非常适合用于个性化的3D生成（如DreamBooth3D应用），在这种情况下,模型可以学习主体的特征,同时保持视角一致性。

团队在关于MVDream的研究论文中写到：

通过在3D渲染数据和大规模文本到图像数据上预训练基础模型,我们的模型可以保持基础模型的通用性,同时实现多视角一致的生成。

通过全面的设计探索研究，我们发现使用带相机矩阵嵌入的3D自注意力机制就足以从训练数据中学习多视角一致性。结果表明，多视角扩散模型可以作为良好的3D先验模型，并且可以通过SDS应用于3D生成，这比当前的开源2D提升方法具有更好的稳定性和质量。最后，还可以在几个镜头设置下训练多视角扩散模型，以进行个性化3D生成。

当然，MVDream目前还存在一定的局限性：

·目前只能生成256×256分辨率的图像,这比原始Stable Diffusion的512×512要小，且当前模型的通用性似乎仅限于基础模型本身。研究团队期望通过增加数据集大小和使用更大的扩散模型替换基础模型来解决上述两个问题,例如SDXL(SDX)。

·研究团队观察到MVDream生成的光照、纹理样式会和渲染数据集很相似,尽管可以通过添加更多样式文本提示来改善,但这也意味着需要更多样化和真实的渲染数据来训练出更好的多视角扩散模型,而这可能需要很高的计算成本。

最后我们还是来看下官方给出与其他类似模型生成的结果对比：

※团队收集了不同来源的多个文本提示,对所有提示均使用默认固定配置,没有使用threestudio软件进行超参数调整。（横向是同一个模型，每一列是不同的技术产生的结果，最右侧是字节跳动最新的技术结果）

an astronaut riding a horse

baby yoda in the style of Mormookiee

Handpainted watercolor windmill, hand-painted

Darth Vader helmet, highly detailed

这么看的话，MVDream生成的模型显然质量不是高了一点点，要是真能达到这个效果，那想想还是挺哇塞的。

参考文章

https://80.lv/articles/this-ai-model-can-turn-text-prompts-into-3d-models/

https://mv-dream.github.io/index.html

End

点击图片进入详情页

杀疯了！火遍全网第七届油管知名CG挑战赛TOP100！

写实纹理的关键是？粗糙度

字节跳动最新AI生成3D模型技术！

官方通报"僧人开宾利载女人":车主不熟悉路请代为驾车

俄方警告：F-16被视为核武器载机将成俄合法打击目标

巴哈马正式承认巴勒斯坦国

土地财政落幕了，地方财政只会越来越紧张，但公职人员普遍不慌

开业仅一年人去楼空？上海张园被传大量撤店，记者实地探访

“武僧一龙”被日本拳手一脚KO 倒台上人事不省日本拳手磕头致歉

俄联邦政府宣布辞职新政府提名审议将于15日前进行

大胜！绿军1-0骑士布朗32+6米切尔33+6+5

网约车司机拿放大镜看导航，乘客表示现在有点慌

“00”后工作不满2年拟任副局长，当地回应三大质疑

湖南人最爱的小龙虾上热搜！疾控：每次食用不超10只

"鸿茅药酒事件"当事人:卖了将近3千套书直播为报平安

香飘飘的拙劣摆拍是对公众的愚弄，无异于饮鸩止渴的自我毁灭

广农糖业：目前暂未向香飘飘直接供货

四川一干部被判刑！让妻子凭关系拿超额年终奖，还暗自窃喜“钱来得太容易”

乘客劝阻大妈地铁上唱歌被怼：“没收费就不错了”

中国4月末外汇储备规模为32008亿美元

以媒：美国证实暂停向以色列运送弹药，“担忧以色列在拉法使用这些炸弹”

为什么很多人辛劳一生，仍然生活在社会底层?

未来3天太阳或爆发M级甚至X级以上耀斑

字节跳动最新AI生成3D模型技术！

官方通报"僧人开宾利载女人":车主不熟悉路请代为驾车

俄方警告：F-16被视为核武器载机 将成俄合法打击目标

巴哈马正式承认巴勒斯坦国

土地财政落幕了，地方财政只会越来越紧张，但公职人员普遍不慌

开业仅一年人去楼空？上海张园被传大量撤店，记者实地探访

“武僧一龙”被日本拳手一脚KO 倒台上人事不省 日本拳手磕头致歉

俄联邦政府宣布辞职 新政府提名审议将于15日前进行

大胜！绿军1-0骑士 布朗32+6米切尔33+6+5

网约车司机拿放大镜看导航，乘客表示现在有点慌

“00”后工作不满2年拟任副局长，当地回应三大质疑

湖南人最爱的小龙虾上热搜！疾控：每次食用不超10只

"鸿茅药酒事件"当事人:卖了将近3千套书 直播为报平安

香飘飘的拙劣摆拍是对公众的愚弄，无异于饮鸩止渴的自我毁灭

广农糖业：目前暂未向香飘飘直接供货

四川一干部被判刑！让妻子凭关系拿超额年终奖，还暗自窃喜“钱来得太容易”

乘客劝阻大妈地铁上唱歌被怼：“没收费就不错了”

中国4月末外汇储备规模为32008亿美元

以媒：美国证实暂停向以色列运送弹药，“担忧以色列在拉法使用这些炸弹”

为什么很多人辛劳一生，仍然生活在社会底层?

未来3天太阳或爆发M级甚至X级以上耀斑

俄方警告：F-16被视为核武器载机将成俄合法打击目标

“武僧一龙”被日本拳手一脚KO 倒台上人事不省日本拳手磕头致歉

俄联邦政府宣布辞职新政府提名审议将于15日前进行

大胜！绿军1-0骑士布朗32+6米切尔33+6+5

"鸿茅药酒事件"当事人:卖了将近3千套书直播为报平安