做一个简单的实验。
打开你网站的某个产品页,按 Ctrl+A 全选,再 Ctrl+C 复制,粘贴到一个空白文档里。
你会看到一堆你没想到的东西:导航菜单的每一个链接文字、面包屑路径、侧边栏里”热门推荐”的八个产品标题、页脚的公司地址和二十几个友情链接、”在线客服”按钮旁边的提示语、Cookie 政策弹窗的那段法律条款……
这些内容,你的访客不会去读。但 AI 要全部处理。
现在看看粘贴出来的文档里,你精心写的产品介绍在哪?它可能被淹没在一堆导航链接和页脚文字中间,只占了全部文字的很小一部分。
这个比例,就是你页面的 Token 密度——有效内容的 Token 数,占页面总 Token 数的百分比。
为什么 Token 密度对 GEO 很重要?
AI 搜索引擎在处理你的网页时,有一个硬性的注意力上限——通常是 16000 个 Token 左右。超过这个量的内容,AI 就处理不了。
但这 16000 个 Token 不是只留给你一个网站。AI 在回答一个问题时,会从多个网站检索内容片段,拼在一起交给大语言模型。你的页面能占多少份额,取决于匹配度和优先级。
这意味着 AI 分配给你的 Token 配额本身就不多。如果你的页面 Token 密度只有 30%——也就是说每 100 个 Token 里只有 30 个是有效的产品信息,另外 70 个是导航栏、页脚、广告位——那 AI 在你的页面上花费的 Token 预算,七成都浪费在了噪声上。
这就像去餐厅吃饭,盘子很大但菜量很少,大部分面积是摆盘装饰。AI 的”胃口”有限,它希望每一口都是”干货”。
Token 密度和信噪比是一回事吗?
基本上是同一个概念的两种说法。
信噪比(SNR)从信号处理的角度讲:有效信号占总信号的比例。Token 密度从 AI 处理的角度讲:有效内容的 Token 占页面总 Token 的比例。
之所以单独做一个”Token 密度检测器”,是因为它的关注点和”AI 可见度分析”(也计算信噪比)不太一样。
AI 可见度分析是一个综合工具——截图、Lighthouse、信噪比、切片,什么都做。Token 密度检测器更专注、更轻量:就看一件事——你页面上的有效内容占了多大比例,噪声来自哪里,哪些可以精简。
如果你只想快速检查某个页面的 Token 效率,不需要跑完整的体检报告,这个工具更合适。
Token 密度检测器:一眼看清有效内容和噪声的占比
操作方式:输入一个 URL,系统抓取页面内容,分别统计:
原始 Token 总量。 页面上所有可提取文本的 Token 数,包括导航、侧边栏、页脚、弹窗等一切文字内容。
清洗后 Token 量。 去掉导航栏、页脚、侧边栏、脚本标签、样式标签等非正文元素后,剩下的正文内容的 Token 数。
Token 密度百分比。 清洗后 Token / 原始 Token × 100%。这个数字就是你的核心指标。
系统还会展示清洗后的正文内容,你可以直接阅读,看看 AI 在去掉所有”噪声”之后,从你的页面上实际拿到了什么。
很多人看到这个结果会意外:原来 AI 读到的内容和自己以为的差距这么大。有些页面在浏览器里看起来内容丰富,但清洗后正文只剩几句话——因为页面上的”丰富感”全靠图片、视频和 CSS 样式撑起来,纯文本内容其实很少。
多少算健康?
没有绝对的标准,但可以参考这个范围:
60% 以上:健康。 大部分 Token 花在了有效内容上。继续保持。
40%-60%:及格。 有一定的噪声,但正文内容占主导地位。可以优化但不紧急。
低于 40%:需要关注。 噪声太多。AI 在你的页面上超过一半的注意力花在了无关内容上。需要精简模板元素或充实正文。
低于 20%:严重问题。 页面几乎没有可用的正文内容。常见于首页、分类页、纯图片展示页。如果这类页面承担着 GEO 的任务(比如你希望首页被 AI 引用),需要大幅增加文字内容。
需要说明的是,不是所有页面都需要高 Token 密度。首页的定位可能就是导航枢纽,不承担具体的内容引用任务。分类列表页也是如此。你需要关注的是那些你希望被 AI 引用的页面——产品介绍页、服务说明页、行业文章页、FAQ 页面——这些页面的 Token 密度要尽量做高。
怎么提高 Token 密度?
两个方向,一减一加:
减噪声。 检查你的页面模板:导航栏能不能精简层级?侧边栏的”热门推荐”能不能从 8 个减到 3 个或者干脆去掉?页脚的友情链接能不能挪到单独的”友情链接”页面?Cookie 弹窗的文字能不能缩短?每精简一处,释放出来的 Token 空间就多一分。
加信号。 正文内容写得更充实。如果你的产品页正文只有 200 个 Token(大概 200 个汉字),把它扩充到 500-800 个 Token——加入选购建议、参数解读、使用场景、常见问题。这些内容不仅提升了 Token 密度,本身也是 AI 可以引用的高价值信息。
两个方向同时做,效果叠加。一个原本 Token 密度 35% 的页面,精简模板后降低了 200 个噪声 Token,同时正文从 200 Token 扩充到 600 Token——密度直接从 35% 跳到 65% 以上。
改完之后回来重新检测一次,看看数字的变化。量化的反馈比感觉靠谱。
