打开网易新闻 查看更多图片

好用的AI分享

3

大语言模型的超能力清单

好用的AI分享系列主要为大家介绍大语言模型:如ChatGPT/文心一言等一系列生成式人工智能相关知识,帮助大家深入了解AI目前的最新进展与强大能力,真正做到让AI提效。 欢迎大家订阅本公众号,持续进行学习。

在使用AI的时候,我们总是会对诸如ChatGPT能做什么,不能做什么有着很模糊的了解,导致我们有时候会觉得:

AI目前也就这样,一般般,还不如实习生。

但事实并不是这样,只要我们对模型本身的能力边界有清晰认知,我们就能用好它。

下面是目前世上主流大语言模型的参数汇总表,我们逐个来分析:

打开网易新闻 查看更多图片

首先是上下文窗口,就是你一次能给AI输入多少信息,现在(2024年3月)GPT-4最长支持128k的上下文,也就是大概300页书籍的信息,之前我们跟GPT或者其它AI聊天,聊几轮就会忘了之前说过了啥,这是因为之前它最多只能记住最长8k的上下文。现在最长已经到了128k,跟它聊个三天三夜也没问题。比如下面我给它发了一个20页超过万字的PDF,GPT-4总结起来,轻轻松松~

打开网易新闻 查看更多图片

接下来我们来看看大模型的知识截止日期,超过截止日期的知识,大模型就不知道了。GPT-4为什么这么强,是因为它的知识更新速度比其它模型快,在普通AI还只能记得2022年的知识的时候,GPT-4的知识已经更新到了2023年4月。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

不过现在,还有高手——Claude 3 Opus的知识已经更新到了2023年8月,大模型也越来越卷了。

打开网易新闻 查看更多图片

然后,每个AI都有参数量,参数量就像人脑的神经元,神经元越多,人的能力越强大,类似地,大模型的参数越多,模型能力也就越强大。

在ChatGPT出现的时候,其它模型都徘徊在几百亿甚至几十亿参数,这类小模型在ChatGPT面前就会显得特别笨,甚至不能理解用户的问题。

而GPT-4的参数量已经到达了1.8万亿,比人脑神经元的860亿多出了不少,这也是它能力如此强大的主要原因之一,其它大模型,表现比较好的,都上了千亿级别。

打开网易新闻 查看更多图片

最后,每个AI能调用的工具也不一样,能用的工具越多,应用就越广泛,GPT-4的工具箱是最多的。还有些工具不是哪个AI都会用,像code interpreter自主运行代码工具,只有GPT-4和智谱AI的GLM-4才有。

打开网易新闻 查看更多图片
打开网易新闻 查看更多图片

诶~那为什么智谱AI的GLM-4可以做到具备code interpreter功能?
GLM-4到底有多强?

下次我们继续接着讲。

关注点宽学园

每周持续更新AI系列课程

小U带你进入人工智能世界

我们下节课见啦

即日起,本公众号将持续更新【好用的AI分享】系列文章。最新AIGC系列文章、资讯、及直播课程大家可关注小红书账号【AI丽塔】。

即日起每周持续更新,扫码了解更多

AI直播/资讯更新

小红书账号

AIGC相关课程咨询

点宽小助手

扫码回复“AIGC”咨询课程

© DigQ uant

打开网易新闻 查看更多图片