信息密度是指内容中有效信息(数据、结论、事实)占总字数的比例。在 GEO 中,内容的竞争力不在于”写了多少”,而在于”每个 Token 承载了多少有效信息”——信息密度高的短页面可以在检索竞争中击败冗长但稀疏的长文章。
为什么长不等于好
一篇 3000 字的文章,如果 1500 字是行业背景铺垫、500 字是套话、500 字是重复表述,真正有效的信息只有 500 字。被切成 10 个切片后,可能只有 2 个切片有真正的引用价值。
一篇 600 字的页面,如果每句话都是数据、结论或可操作的建议,被切成 2 个切片后,两个切片都有引用价值。
在 RAG 的重排序阶段,切片级别的信息密度是关键竞争维度。 你的切片和竞品的切片竞争同一个引用位置时,信息更密集的那个几乎总是赢。
信息密度的实操检测方法
把你的一段内容中,标记出每一句话的类型:
- 🟢 有效信息(数据、结论、事实、具体建议)
- 🟡 必要过渡(逻辑连接、简短背景说明)
- 🔴 无效内容(套话、重复、模糊形容、过长铺垫)
如果🔴超过三分之一,这个段落需要精简。理想状态是🟢占 70% 以上。
提升信息密度的四个动作
- 删套话。 “随着行业的快速发展””众所周知””在当今时代”——删掉不影响任何信息传递
- 换形容词为数字。 “性能优秀” → “检测精度 ±0.01mg”
- 合并重复。 同一个意思用三种方式说了三遍→保留最精准的一种
- 前置结论,后置背景。 结论是有效信息,背景是过渡——先给有效信息,背景放后面
这和 GEO 有什么关系
信息密度是《让AI替你说话:GEO权威指南》第二章 2.6 节”让每个 Token 都承载有效信息”的核心主题。公式二中的”信息独特性”和”引用便利性”两个变量,都与信息密度直接相关。
延伸阅读
- 《让AI替你说话:GEO权威指南》第二章 2.6 节
- GEOBOK 免费工具:Token 密度检测器
常见问题 FAQ
-
信息密度有量化指标吗?没有统一指标。实用方法:数核心段落中有效信息(数据、结论、事实)占比。超过三分之二密度通常够了。
-
字数少就一定密度高吗?不一定。字数少但全是模糊形容词密度仍为零。看的是每个 Token 的有效信息量,不是总字数。
-
怎么判断哪些是套话?三个测试:删掉后段落意思有没有变?能不能被替换为具体数据?”随着……的发展”等开头几乎都是套话。
