大模型上下文窗口长度为何很“卷”？一文看懂

最近很多人发现：随着LLM越来越热，大模型的上下文窗口的长度也越来越长了。

以openAI为例，仅在今年GPT-4就从一开始的4K、8K拓展到了128k（此为GPT-4-turbo支持的上下文窗口长度）。国内大模型赛道玩家比如百川智能，10月底发布的Baichuan2大模型，上下文窗口长度已突破至192K。

就在上个月，另一家AI公司Anthropic推出Claude2.1，其LLM模型的上下文窗口长度更是达到了200K（其实国内AI服务商如零一万物、月之暗面等也称已达到同一长度）。

数据参考自网络，排名不分先后

眼看大模型可支持的上下文窗口长度越来越长，很多人表示：未来没有更长，只有更卷。

但上下文窗口长度的突破真这么容易吗？为什么这么多头部人工智能企业都在上下文窗口长度这点上“卷”得不亦乐乎？上下文窗口长度技术上的突破能带来哪些价值？

如果你也好奇，下面我们一起来看看。

大模型上下文窗口长度突破难吗？

根据对主流LLM厂商采访的整理，延长大模型上下文窗口长度涉及算力、算法、工程能力等方面，其实整体的实现难度并不低。

比如超长上下文窗口会有更高的算力需求，仅Transformer模型中自注意力机制的计算量，就会随着上下文长度的增加呈现平方级增长。

众所周知，算力就意味着高投入，尤其是存储和训练这块。据媒体报道：目前很多的显存容量和带宽就还跟不上超长上下文的使用需求。此外，显存压力也是实现超长上下文窗口无法忽视的点。

兼顾文本长度和推理速度，对于训练算法和工程能力是另一大考验。因为一般情况下，随着计算量暴涨，会导致用户等待时间变长，而且反馈速度和效度也会受影响。

为了不影响推理速度，可能尝试模型降级（如变大模型为小模型），或者功能降维（例如减少计算量、牺牲即时存储等基础功能）等方法，但这样很容易导致模型性能和应用价值大打折扣。

在这样的情况下，要想保障实现较长的上下文窗口长度，同时保持应有的性能，意味着：硬件配置、算法优化、工程代码性能等方面，都需要同步强化，这也让文本长度的升级面临着较高门槛。

上下文窗口长度为何越来越卷？

虽然有难度，但面对提升对话框容量所能带来的价值，“卷”依然成了自然而然的选择。

比如随着上下文窗口长度的增加，可以提供更丰富的语义信息，有助于减少LLM的出错率和「幻觉」发生的可能性，用户使用时，体验能提升不少。

同时，它能解决很多人在长对话或长文档推理这类业务上的痛点，也能很好地应用于智库、调研、科研、教育等这类此前涉足不深的业务场景。

另外，作为大模型的核心技术之一，很多LLM服务商也将「长文本输入」视为自身底座大模型的差异化竞争力，从而热心于上下文窗口长度的拓展。

文本长度技术突破能带来哪些价值？

对于普通人来说，随着上下文窗口长度的发展，进行长时间对话或处理长文档资料时，不会因为聊得久而失去上下文记忆，也不会因为“超出文本限制”的提示语而被轻易打断。

毕竟200K的超长上下文窗口足以满足普通人甚至海量级别的文本输入需求（比如200K的超长上下文窗口版本，可以处理约40万汉字规模）。

处理文本密集型文档或进行长篇创作时，也能从容地应对，不担心容量限制而输入不了，或者出现信息丢失或模型「幻觉」等情况，能进一步提升生成精度和效度。

对于企业来说，搭建内部信息知识库时，需要处理海量数据集。随着上下文窗口长度延长，搭配大语言模型单次能完成的容量也能大幅提升。

鉴于这一技术在处理长对话和长文档中的应用，目前，还有一些AI厂商针对已有大模型推出了超长文本扩展技术，以拓展现有的模型文本长度。

值得注意的是：增加上下文长度并不是提升语言模型性能的唯一条件，就像上面提到的，拓宽容量限制的同时，其实算力、算法、工程实现、模型构架等方面会面临更多的挑战。要想确保容量拓展后，依然保持较高的性能和生成质量，配套的软硬件条件其实都能跟上。

大模型上下文窗口长度为何很“卷”？一文看懂

大模型上下文窗口长度突破难吗？

上下文窗口长度为何越来越卷？

文本长度技术突破能带来哪些价值？

iOS/iPadOS 17.5 “照片复活门”升级：二手设备可显示原机主照片

12306回应"靠窗一等座没窗户"：靠窗不能保证都有窗户

中国微软员工大搬迁，近八百人收到调动offer，亲属可跟

参加俄军的华人小伙巷战后和黑人战友感叹：这仗没法打了太费人了

不香了？从每天6亿到每天22亿！俄央行再次加大抛售人民币力度

北上广深均宣布下调住房公积金贷款利率

俄外长：俄愿与西方在平等条件下进行对话

黑龙江省最低工资标准调整

网友爆料疑似新能源车漏电，用电笔测试显示有电！

金价达740元/克女子后悔没买黄金:买了堆施华洛世奇

中方：令人深感愤慨！

上海九星城建设进展如何？已有逾千家商户意向签约，预计明年开业

沙特国王发生高热将进行医疗检查

乌无人机冲向俄军阵地俄士兵顶汤锅当头盔

莫文蔚“忽然之间”闪现成都街头，这距离听歌真的太让人羡慕了！路人纷纷夸赞好美好瘦好好听！

吴艳妮12秒80夺冠创下3大纪录！今年亚洲第一人，网友排队道歉

被俘俄士兵哭诉:我们被指挥官骗了他说前面有战利品

中央督察通报“鄱阳湖保护修复不力，生态环境问题多发”，江西省委书记尹弘赴现场督导

一百年后，林徽因获得了建筑学士学位

俄称继续在哈尔科夫地区推进战线

大模型上下文窗口长度为何很“卷”？一文看懂

大模型上下文窗口长度突破难吗？

上下文窗口长度为何越来越卷？

文本长度技术突破能带来哪些价值？

iOS/iPadOS 17.5 “照片复活门”升级：二手设备可显示原机主照片

12306回应"靠窗一等座没窗户"：靠窗不能保证都有窗户

中国微软员工大搬迁，近八百人收到调动offer，亲属可跟

参加俄军的华人小伙巷战后和黑人战友感叹：这仗没法打了太费人了

不香了？从每天6亿到每天22亿！俄央行再次加大抛售人民币力度

北上广深均宣布下调住房公积金贷款利率

俄外长：俄愿与西方在平等条件下进行对话

黑龙江省最低工资标准调整

网友爆料疑似新能源车漏电，用电笔测试显示有电！

金价达740元/克 女子后悔没买黄金:买了堆施华洛世奇

中方：令人深感愤慨！

上海九星城建设进展如何？已有逾千家商户意向签约，预计明年开业

沙特国王发生高热 将进行医疗检查

乌无人机冲向俄军阵地 俄士兵顶汤锅当头盔

莫文蔚“忽然之间”闪现成都街头，这距离听歌真的太让人羡慕了！路人纷纷夸赞好美好瘦好好听！

吴艳妮12秒80夺冠创下3大纪录！今年亚洲第一人，网友排队道歉

被俘俄士兵哭诉:我们被指挥官骗了 他说前面有战利品

中央督察通报“鄱阳湖保护修复不力，生态环境问题多发”，江西省委书记尹弘赴现场督导

一百年后，林徽因获得了建筑学士学位

俄称继续在哈尔科夫地区推进战线

金价达740元/克女子后悔没买黄金:买了堆施华洛世奇

沙特国王发生高热将进行医疗检查

乌无人机冲向俄军阵地俄士兵顶汤锅当头盔

被俘俄士兵哭诉:我们被指挥官骗了他说前面有战利品