作者|袁博
来源|AI先锋官
等了四个月的ChatGPT高 级语 音模式,终于上线了。
就在昨天,OpenAI正式宣布,ChatGPT高级语音模式(Advanced Voice Mode)将于本周内正式面向Plus用户及Teams用户推出 ,企业和教育客户将于下周开始获得访问权限。
OpenAI首席执行官Sam Altman在社交平台上难掩兴奋之情,表示“希望你们觉得等待是值得的”,还加上了委屈和比心的表情。
不止如此,OpenAI还发布了一个包含 14 种语言的多语言数据集,用于评估语言模型的性能。
需要注意的是,全新的语音功能适用于Open AI的GPT-4o模型,不适用于最近发布的预览模型o1。
巧的是,语言学习软件多邻国在 昨天凌晨 也推出了AI视频通话功能,用户可以和多邻国角色“拽姐”练习口语。 不过,目前只适用于英语、西班牙语和法语。
OK,现在回到ChatGPT,就让我们来看看它都有什么“高级功能”吧。
据介绍,ChatGPT高级语音模式支持超50多种语言。
官方也发布了一条演示视频“显摆”了一下。
有意思的是,经网友测试,发现它不仅懂各种腔调的英语和很多小语种,甚至连中国方言都懂。
(视频来源微博用户:互联网的那点事)
就连日本口音的英语它也学得有模有样。
此外,ChatGPT高级语音模式还新增了5个各具特色的声线,分别是:阿伯(Arbor)、梅普尔(Maple)、索尔(Sol)、斯普鲁斯(Spruce)和维尔(Vale)。
加上此前的四种声线,用户现有9种声线选择,几乎与谷歌的Gemini Live一样多。
值得注意的是,OpenAI 在春季更新时展示的“天空(Sky)”声音并未出现在此次更新中。
此前,著名演员斯嘉丽·约翰逊(Scarlett Johansson)指控OpenAI的ChatGPT非法使用其声音,同时要求将语音下架。
除了语言丰富这一特点外,它还有两大亮点,一是支持用户为语音助手设定“自定义指令”;二是具备“记忆”功能,能记住用户偏好的交互方式。
官方也发布了其演示视频,就让我 们一起来看一看吧。
可以看到,在ChatGPT系统内不仅可以可以自定义对话语速,也可以预设个人姓名与住址信息,这样ChatGPT就可以使用预设的名字与用户交流。
当你预设完住址信息后,再发起新一轮对话时,如询问“这个周末天气真好,户外有什么有趣的活动可以推荐吗?”高级语音助手将调用用户之前输入的住址信息,主动推荐周边的游玩地点,甚至贴心地规划出行路线。
是不是很方便。
只不过,有一点比较遗憾,就是它有时长限制!网友们体验都发现,只能和ChatGPT聊45分钟左右。
对此,OpenAI的官方回答是,每天的限制时间可能都不一样,当天还剩15分钟时,会进行提醒。
但话又说回来了,苍蝇腿也是肉,那也比吃“饼”强,OpenAI的饼可真是没少吃,所以说,有条件的小伙伴还不赶紧去试试!
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。
往期文章回顾