
大多数人实际上并不了解人工智能和我们每天接触的人工智能之间的区别。

我们使用的工具,例如 ChatGPT、图像生成器和写作助手,不仅仅是“人工智能”。它们是生成式人工智能 (GenAI),一种非常特殊的机器学习类别,旨在通过预测下一步的内容来生成内容。
作为一个在研究和创意工作之间游走的人,我并不认为GenAI是什么神奇的工具。我更把它看作一个 导航系统。每次我们启动它,它都会给出方向,但并非在开放的地图上。我们研究的路线,都是前人已经走过、绘制过、优化过的。
人们越是遵循这些路线,它们就越是固定不变。所以,虽然感觉像是在探索新事物,但大多数时候,你只是被引导着走上最热门的路线。除非你了解模型是如何训练的、如何预测的,以及它的局限性,否则你只会在熟悉的道路上兜圈子。
这就是为什么我认为我们应该停止将通用人工智能(Gen AI)视为巡航控制系统,而应该开始学习它的实际工作原理。如果你感觉提示让你陷入循环,那不是你的想象,而是你只是在沿着一条已经铺好的路走。让我们看看它从何而来,GenAI 是如何运作的,以及当我们的大多数道路都通向同一个目的地时,它意味着什么。
历史:从逻辑机器到语言模型
“人工智能”一词诞生于1956年的达特茅斯夏季研究项目中。早期的人工智能系统专注于符号推理和逻辑问题解决,但受限于有限的计算能力。想想莫腾·泰杜姆2014年执导的电影《模仿游戏》中的密码机。这些限制导致了20世纪70年代第一个人工智能寒冬,当时人们对人工智能的兴趣和资金急剧下降。
到21世纪初,计算能力、算法开发和数据可用性的进步开启了大数据时代。人工智能从理论模型转变为实际应用,自动化执行结构化数据任务,例如亚马逊和Netflix的电商推荐引擎、早期的社交媒体排名算法以及谷歌自动完成等预测文本工具。
2017年,谷歌研究人员在开创性论文《Attention Is All You Need》中提出了Transformer架构,标志着一个变革性的里程碑的到来。 这项创新促成了大型语言模型(LLM)的发展,并奠定了当今生成式人工智能系统的基础结构。
功能:Gen AI 如何以平均值来思考
一切都始于训练数据:海量文本,经过清洗、过滤,然后分解成称为“token”的小部分。一个“token”可能是整个单词、单词的一部分,甚至是标点符号。每个“token”都被分配一个数字ID,这意味着模型实际上并不读取语言,而是处理代表语言的数字流。

一旦被标记化,模型就会通过反复预测序列中的下一个标记来学习,这个过程要跨越数十亿个示例。但并非所有数据都会被平等对待。高质量的来源,例如精选书籍或同行评议文章,比随意的网络文本拥有更高的权重。这会影响某些标记模式被强化的频率。
因此,如果某个短语在高质量的语境中反复出现,模型就更有可能将该短语内化为可靠的模式。本质上,它学习的是“平均”响应的样子,不是数学平均值,而是通过收敛到统计上最稳定的延续。这种平均过程并不局限于训练。当你使用模型时,它会再次出现。
你输入的每个提示都会被转换成词条,并经过模型的层层传递,每个词条都会使用所谓的自注意力机制(一种实时上下文加权平均的方法)与其他词条进行比较。这些权重不会透露给输入提示的用户。然后,模型会根据它所看到的所有模式,输出它认为最有可能的词条。
这使得系统严重倾向于中位数,即分布的安全中间值。这就是为什么答案通常感觉精雕细琢却又谨慎小心,它们经过优化,力求找到最有可能正确的答案,从而避免出错。
您可以使用名为“温度”的设置来更改“平均值”,该设置控制模型对中值结果的关注程度。在低温下,模型会接近统计中心:安全、可预测,但略显平淡。
随着温度升高,模型开始将概率从中值向外分散,从而允许一些不太常见、更令人惊讶的标记混入其中。但这种变化也带来了波动性。当模型输出偏离分布中心时,得到的是随机性,而非创造力。
因此,无论是在训练中还是在实时生成中,Gen AI 的构建都是为了复制中间结果。它的智能(如果我们可以称之为智能的话)在于它能够将数十亿种可能性提炼成一个标准化的输出。虽然这非常强大,但它也揭示了系统的根本局限性:它不会创造意义,只会对意义进行平均。
人工智能提示:无需看路即可操控系统
提示不仅仅是提出问题,而是要缩小模型在训练过程中所映射的精确统计范围。当我们编写提示时,我们会在标记空间中导航,触发模型之前见过的模式,并从系统中嵌入的平均值中提取。

提示越具体,围绕特定词条及其学习概率的聚类就越紧密。但我们常常忘记,用户界面正在平滑层层复杂性。我们看不到词语选择的加权影响,也看不到那些影响响应随机性的隐形温度设置。
这些模型是为服务普通受众(另一种平均水平)而构建的,这使得精准引导他们变得更加困难。因此,虽然提示看起来似乎是无限的,但实际上它实际上是在与隐形分布和系统默认进行协商,而这些默认设置比我们想象的要具有更大的决定性。
像 PICO(角色、指令、上下文、输出)或 RTF(角色、任务、格式)这样的快速框架可以帮助塑造结构,但值得记住的是,它们也是建立在对大多数人最有效方法的假设之上的。这仍然是一个平均值。有时你会很幸运,模型的输出会超出你的认知范围,听起来可能很精彩、很有见地,甚至可能很新颖。但当你把它交给一个对这个主题很了解的人时,就会很明显:它听起来很像人工智能。
诀窍就在于理解你触发的平均水平,并判断它是否符合你的目的。谁会读这篇文章?他们期待什么?他们需要什么程度的深度或原创性?这些才是你写作主题的核心。无论你使用结构化框架,还是自由写作,重要的是明确目标,并了解你所处的领域。
有时,最好的策略是:关闭聊天窗口,打开一个新窗口。之前的标记、缓存路径和上下文历史记录的权重可能会影响结果。这不是你的错。只是平均值有点杂乱。重新开始,重新校准,争取获得更好的中位数。
结论:当平均值成为界面
让我担忧的一件事是,GenAI 背后的公司是如何学习针对平均水平进行优化的。越多人使用这些带有快捷工程模板和框架的工具,系统就越会开始围绕这些模式进行自我塑造。这些模型经过训练以适应,而它们适应的正是我们,我们的习惯、我们的捷径、我们的结构化格式。
那么,当界面本身开始强化这些相同的平均值时,会发生什么呢?任何超出可能、预期和熟悉范围之外的东西都变得越来越难。那些奇怪的、原创的、统计上不可能的,这些都开始逐渐淡出人们的视线。
当我们考察代理型人工智能时,情况就变得更加复杂了。这种人工智能似乎能够自行做出决策或提供强大的输出。它或许非常令人信服。但问题在于:它仍然建立在平均值之上。我们不仅要承担写作或研究的任务,还要承担思考本身的风险。当机器被调整以反映最常见的情况时,我们不仅仅是在外包智力,我们还在外包我们对细微差别的感知,以及持有非中立观点的能力。
所以,下次当人工智能给你一些感觉异常精彩或显而易见的东西时,停下来想想到底是怎么回事。它并非创造性的。它只是在导航,从它之前见过的最常见、最被接受、最重复的路径中抽取灵感。你的提示触发了这条路线,而这条路线反映了成千上万个像你一样的人的提示。
一旦你理解了这一点,你就可以开始更有意识地驾驶。你可以识别出你的方向何时被改道,穿过热门车道,何时该离开高速公路。有时,当输出结果平庸得让人感觉不正常时,最明智的做法很简单:关上窗户,重新设置路线,然后重新开始。因为有时,找到新事物的唯一方法就是停止随波逐流。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。 如有侵权,请与我们联系。 所有信息仅供参考和分享,不构成任何投资建议。投资者应基于自身判断和谨慎评估做出决策。 投资有风险,入市需谨慎。
关注我们,一起探索AWM!
近期热
2025-05-08
2025-05-06
2025-05-06