12月2日消息,没等到OpenAI12连炸结束,谷歌直接正面硬刚,正式发布 Gemini 2.0系列 AI 模型首个版本 Gemini 2.0 Flash。据谷歌称,其速度较上一代提升两倍,并超越1.5 Pro 专业版。新模型支持多模态输入与输出,包括文本、图像、音频、视频的原生生成,同时提供强大的工具调用能力,如 Google 搜索、代码执行及第三方函数集成。
比起功能上的提升,谷歌直接将 Gemini 2.0定义为:为新智能体时代构建的下一代模型,或许更值得关注。Deepmind CEO Demis Hassabis 也表示:“2025年将是 AI 智能体的时代,Gemini 2.0将是支撑我们基于智能体工作的最新一代模型。”
Gemini 2.0 Flash 的开发者实验版现已上线,支持多模态输入及文本输出功能。早期合作伙伴还可试用文本转语音及图像生成等高级功能。全面版本计划于2024年1月推出,支持更多模型尺寸及场景。
不止大模型,全新功能 Deep Research 今日起也将向 Gemini Advanced 用户开放。该功能支持高级推理与长上下文理解,用于复杂主题研究及报告撰写。同时,AI Overviews 将借助 Gemini 2.0的能力,扩展至更复杂问题与多语言适配,进一步提升用户体验。(袁宁)
本文来自网易科技报道,更多资讯和深度内容,关注我们。