Lost in the Middle：长上下文中的位置效应与内容边界

“中间迷失”（Lost in the Middle）是多项研究发现的一个现象：大语言模型在处理长上下文时，对开头和结尾位置的信息利用率往往高于中间位置。你的核心信息如果恰好落在上下文的中间位置，即使 AI “看见了”，也可能没有充分利用。

通俗理解

想象你要一个人在 5 分钟内读完一份 20 页的报告，然后口头汇报要点。

大多数人会清楚记得报告开头的概述和结尾的结论，但对中间部分——第 8 到第 14 页的细节——记忆模糊。

大语言模型也有类似的倾向。虽然它理论上可以”看到”上下文窗口中的每一个 Token，但在实际生成回答时，对靠前和靠后位置的信息利用率更高，对中间部分的信息利用率相对较低。

2023 年由 Stanford 和 UC Berkeley 等机构联合发表的论文 “Lost in the Middle: How Language Models Use Long Contexts” 系统研究了这个现象。主要发现包括：

需要指出的是，新一代模型（包括 GPT-4o、Claude 3.5 等）正在逐步缓解这个问题，但位置偏好仍然是一个值得重视的因素。

在 RAG 场景中，多个检索到的切片被拼接后注入模型的上下文窗口。你的切片在拼接后的位置取决于重排序的得分——得分最高的切片通常放在最前面。

但如果你的切片得分不是最高但也不是最低——恰好排在中间——模型可能”看到了你的切片但没有充分利用”。

你无法控制切片在上下文中的位置，但你可以控制切片本身的”注意力吸引力”。

即使在中间位置，模型在扫描上下文时，每个切片的首句仍然会获得较高的初始注意力。如果首句就是核心结论（而不是铺垫），模型的注意力更容易被”锁定”。

数字是注意力的天然锚点。”增长 23%””精度 0.01mg””328 条评价”——这些数字在任何位置都比纯文字描述更容易被模型”捕获”。

模型对高信息密度的内容有选择性注意力倾向。一个充满有效信息的切片（数据+结论+来源），比一个大量铺垫的切片更容易突破”中间迷失”的效应。

归根结底，避免”中间迷失”的最佳策略是不要落在中间——让你的切片在重排序中获得更高的得分，排在更靠前的位置。这依赖于信息密度、权威信号和语义匹配度的综合竞争。

“中间迷失”效应是《让AI替你说话：GEO权威指南》第二章 2.4 节讨论”位置影响利用率”的技术基础，也是相关策略（位置编码·信息前置）背后的研究支撑之一。

它再次印证了全书的核心写作原则：结论前置、信息密集、每段可独立理解。 这些原则不是锦上添花，而是在中间位置也能”存活”的生存策略。