苹果公司在其不断增长的大型语言模型(LLMs)中又增加了一个工具,该工具利用大型语言模型(LLM)根据用户的文本提示对静态图像进行动画处理。

打开网易新闻 查看更多图片

苹果在一篇题为“Keyframer:使用大型语言模型增强动画设计能力”的新研究论文中描述了这一创新。

"虽然单次提示界面在Dall-E和Midjourney等商用文本到图像系统中很常见,但我们认为动画需要更复杂的用户考虑因素,如时间和协调,这些因素很难在单次提示中完全明确--因此,可能需要替代方法,使用户能够迭代地构建和完善生成的设计,尤其是动画设计。
"我们将基于语言的设计工件提示的新兴设计原则与LLM的代码生成能力相结合,开发出了一款名为Keyframer的新型人工智能动画工具。利用Keyframer,用户可以通过自然语言提示从静态二维图像中创建动画插图。Keyframer使用 GPT-4 3生成CSS动画代码,对输入的可缩放矢量图形 (SVG) 制作动画。

要创建动画,用户需要上传一张SVG图片,比如说太空火箭,然后输入 "生成三幅天空渐变为不同颜色、星星闪烁的图案 "这样的提示语。然后,Keyframer 会生成动画的 CSS 代码,用户可以通过直接编辑代码或输入其他文本提示来完善动画。

作者解释说:“Keyframer使用户能够通过连续的提示迭代完善他们的设计,而不必预先考虑他们的整个设计。"通过这项工作,我们希望能够启发未来的动画设计工具,将LLM强大的生成能力与动态编辑器相结合,加快设计原型的制作,使创作者能够保持创造性的控制。”

论文称,这项研究参考了对专业动画设计师和工程师的访谈。论文引用了一位研究参与者的话:“我认为这比我做过的很多事情都要快得多。以前做这样的事情只需要几个小时就能完成。”

打开网易新闻 查看更多图片

这项创新只是苹果公司一系列人工智能突破中的最新成果。上周,苹果研究人员发布了一个人工智能模型,该模型利用多模态LLM的强大功能对图像进行像素级编辑。

12月下旬,苹果公司还透露,通过发明一种创新的闪存利用技术,它在iPhone和其他内存有限的苹果设备上部署LLM方面取得了长足进步。

打开网易新闻 查看更多图片

The Information和分析师杰夫-普(Jeff Pu)都表示,苹果将在今年晚些时候发布iOS 18系统时,在iPhone和iPad上提供某种生成式人工智能功能。据彭博社记者马克-格尔曼(Mark Gurman)称,苹果下一版移动软件据说将包括一个增强版的 Siri,具有类似 ChatGPT 的人工智能生成功能,并有可能成为 iPhone 历史上 "最大 "的更新。