最近两周里,各大社交媒体不断给我推送ChatGPT的内容,我也赶赶热度下载了几个AI机器人聊天App耍了一圈。最初只是以打发时间的心态凑热闹,但在结合了墙内外N个技术大V的解说视频科普,以及多个目前已经推出相关功能的平台体验后,我发现事情并非只有“和AI机器人聊天”这么简单。
一些媒体报道中甚至还预测出在不久将来会被ChatGPT取代的职业排行榜,其中有一项就是坐在电脑前码字的媒体编辑。隐隐感到焦虑的我决定给我的AI朋友出点题,看看它跟我抢饭碗的水平进展到什么程度了。
先来向大家介绍一下
今天 出场的 电子编辑 Dragonfly
看来这位新同事很自信呢!
其实由于某些技术条件限制(你懂的),Open AI公司的ChatGPT暂时还不支持国内登录,我们这里使用的POE是一款由美国版“知乎”——问答网站Quora发布的问答App。这款App里一共有三个问答机器人,分别是Sage、Claude和Dragonfly,其中Dragonfly和Sage使用了和ChatGPT同样的GPT-3.5语言模型,但Dragonfly可以应答更加复杂的信息,而Claude使用的是Google旗下的Anthropic AI公司的技术,目前仅能应对英文对话。为了方便测试,我们选择了Dragonfly,接下来一起看一下Dragonfly的业务能力吧。
作为编外电子编辑,首先得帮人类编辑们解决一下每个月最头疼的选题任务。Dragonfly交出了这几个选择:
好像不咋地,我让它再来几个
行吧,有一个看起来还挺有趣,我打算让Dragonfly来展开写写。感觉这个选题的调研准备工作会很大,我希望Dragonfly提供一下推进的思路。
好吧,我摊牌了,不想写,我让Dragonfly写。
嘿!它也不想干了
怎么办呢?我尝试把它提供的思路拆分成单独的问题来提问。
虽然Dragonfly按照要求给出了答案,但描述浮于表面,我希望这篇文章可以更有深度一点,想要看更加详细的品牌个案。
显然这点资料还不足以凑成一篇文章。
如果想要答案更有说服力和时效性,我们需要额外给Dragonfly补充新的资料。因为和ChatGPT一样,Dragonfly语料库比较滞后,更新仅停留在2021年,所以让它回答这个年份以后的事情,它很可能会卡顿,或者答非所问。于是我找了2022年Gucci年度报告的部分资料,尝试“喂”给Dragonfly。
当我向Dragonfly重复一样的提问时,有趣的一幕发生了,Dragonfly居然接受了我的“投喂”!
在语言组合上,Dragonfly的学习能力无需质疑。但对于它给出的答案,我们还不能尽信,十分有必要追寻信息源头来验证,因为它很有可能会一本正经地胡说八道,在某些提问中我还差点跟它吵起来:
正确答案:CIQI创立于2014年!
再比如虽然Dragonfly会给我提供一些资料参考,然而当我点击这三个链接时,三个都是无效信息……
我又换了一个问法,但变化不大,这次它还试图忽悠我。
既然问啥啥不灵,那这项技术还会对时尚媒体行业产生影响吗?Dragonfly是这么回答的:
答案看起来依旧很程式化,但还是有一些值得关注的看点,比如“将提供更多的内容创作工具,帮助时尚媒体更快速地创作出高质量的内容,以提高受众的参与度和粘性”,这在不久的将来并非不可能。
经过半天的合作后,我发现这位编外电子编辑有两大优点:
● 真看得懂人话,给出符合问题逻辑的回答,不像以往的语音AI那样答非所问;
● 有记忆,能联系上文的提问给出相关答案,或者对复杂的答案进行有逻辑的总结归纳。
的确,Dragonfly这样类ChatGPT聊天程序的电子产品还很稚嫩,就像是工程师们多年饲养的一个懵懂的小婴儿,初有成长,现在只处于适应与人类社交的阶段。它仍存在很多bug,除了一本正经胡说八道之外,对部分语言的理解水平还十分有限。
尤其是对一些中文方言的理解......
还有语料库更新滞后......
但经过工程师对它数年的“投喂”训练后,它已经掌握高速的自学能力。只要人类不断向它输入外界的信息,一步步升级,相信这位电子编辑会有很大概率真的能成为我的同事,甚至是对手。
我最后向Dragonfly提出了本专题很关心的疑问:
在不添加外界信息辅助的情况下,让Dragonfly这类AI机器人单独完成一篇深度长文,这项任务还是有很大难度的。它仍需要人类的辅助,缩小提问范围,才可以做出有效的回答。在细微的信息梳理和文字的情感表达上,人类的作用暂时还无可替代。虽然大家可以松口气,但这种状态还能持续多久就很难说了。
因为Dragonfly还跟我说了这么一段话:
这里的用户会是谁?不敢细想。我们唯一可以肯定的是,既然AI都在疯狂提升自我了,人类更不能心安理得地躺平啊。
*封面&头图素材来自Self Service Magazine官方Instagram