打开网易新闻 查看更多图片

谷歌正准备发布其备受期待的对话式人工智能系统 Gemini,对抗OpenAI 推出的 ChatGPT 在这方面的领导地位。

谷歌已向部分公司开放了 Gemini 的测试,这表明其面向消费者的推出可能即将到来。Gemini 是多模态大语言模型,这意味着它本身可以接收不同模态的输入,例如文本、图像、音频等。

报告称,谷歌目前向开发人员提供相对较大的 Gemini 版本,但不是其正在开发的最大版本,该版本将更接近 GPT-4。该模型由 Google DeepMind 部门(Brain Team + DeepMind)开发。

这家搜索和广告巨头计划通过其 Google Cloud Vertex AI 服务向企业提供 Gemini。

上个月,该公司在其为印度和日本用户提供的搜索工具中引入了生成式人工智能,该工具将根据提示显示文本或视觉结果,包括摘要。它还向企业客户提供人工智能驱动的工具,每月价格为每用户 30 美元。

半导体研究公司 SemiAnalysis 报告称,谷歌即将推出的生成式 AI 工具目前比市场上最先进的 GPT-4 模型强大五倍。此外,他们预计到 2024 年,该人工智能工具的功能可能比ChatGPT强大 20 倍。

谷歌首席执行官桑达尔·皮查伊在 5 月份的 Google i/o 主题演讲中表示:“Gemini 从一开始就是为了实现多模式而创建的。”虽然还处于早期阶段,但我们已经看到了之前型号中未曾见过的令人印象深刻的多模式功能,”他补充道。

这将使这家科技巨头与 OpenAI 的热门聊天机器人 ChatGPT 展开竞争,后者自去年 11 月推出以来一直引起巨大轰动。从金融科技到医疗保健,企业已经投入巨资来利用其不可思议的对话能力。

但皮查伊似乎对人工智能决斗的前景并不感到不安。

当被问及谷歌是否应该更早推出 ChatGPT 竞争对手时,皮查伊告诉媒体:“我并不完全清楚它是否也能取得成功。”

自 2016 年以来,皮查伊一直在加大对谷歌“人工智能优先未来”的投资。但他认为,在正式投入使用之前需要更多时间来完善其模型。

谷歌在二月份首次推出了基于 LaMDA 的聊天机器人 Bard,但由于弄错了詹姆斯·韦伯望远镜的基本事实,结果显得有点失败。但Bard此后进行了重大升级,以利用谷歌新的多模式模型 PaLM 2,该模型“显着优于”其前身,通过比较测试可以证实这一点。

改版后的 Bard 已经证明,它可以在某些领域与 ChatGPT Plus 针锋相对,同时免费且更容易使用。与 ChatGPT 相比,Bard 提供了更快、更符合上下文的翻译。它还在生成代码时碾压了竞争对手,支持 20 多种编程语言。但 ChatPGT 凭借其高级数据分析工具在这方面迎头赶上,该工具已将聊天机器人变成了强大的编码机器,现在比 Bard 的本机功能更先进。

Bard与谷歌庞大的实时搜索引擎的集成使聊天机器人在回答正在发生的事情方面具有优势。谷歌也是 Anthropic 的主要投资者,Anthropic 是Claude AI背后的初创公司,也是 ChatGPT 迄今为止最强大的竞争对手。

Claude 可以处理超过 100K 的上下文令牌,这意味着用户可以向聊天机器人提供比 ChatGPT 可以处理的信息多 10 倍的信息。就质量而言,介乎于 GPT3.5 和 GPT-4 之间。凭借 Claude 的大上下文能力、Bard 与 Google 面向普通消费者的集成以及 Gemini 的多模式能力,Google 正在寻求主导 AI 领域,并夺取目前由 OpenAI 和微软占据的王位。

谷歌还在寻求人工智能的“生态系统方法”,将生成能力集成到其文档、地图和搜索等产品中。就在本周,它宣布了新的人工智能升级,旨在改善人们在线查找和使用信息的方式。

随着 Gemini 的伺机而动,OpenAI 的人工智能帝国可能很快就会面临迄今为止最大的挑战。但目前看来,皮查伊很乐意采取缓慢而稳定的方法。

想当年谷歌的AlphaGo大战李世石,战胜柯洁引发世界关注,在人工智能方面一骑绝尘。谷歌是多么的风光,然而近年却鲜有领先的技术推出。让OpenAI 的ChatGPT惊艳表现夺走所有人的目光。

如果 Gemini 不负众望,它可能会推动交互式人工智能的变革,与谷歌“以负责任的方式为数十亿人带来人工智能”的雄心相一致。