🧬 网页 Token 密度检测器

剖析网页语料效能,识别冗余 Token,提升 AI 引擎的索引权重与召回率。

📖 这个工具可以做什么?

你网页上的每一个字符——包括看不见的 HTML 标签、CSS 样式、JavaScript 代码——都会被 AI 转化为 Token 消耗上下文窗口。这个工具快速测量页面的信息纯度:原始 HTML 有多少 Token,清洗后剩多少有效文本 Token。

详见《让AI替你说话:GEO权威指南》第二章 2.2 节

❓ 常见问题:对 GEO 的影响

Token 密度和 GEO 有什么关系?

AI 上下文窗口有限,信噪比越高,有效信息占比越大,检索竞争力越强。详见《让AI替你说话:GEO权威指南》第二章 2.2 节。

这个工具和「AI 可见度分析」有什么区别?

Token 密度检测器只做轻量信噪比计算(5-10 秒),不跑 Lighthouse 也不截图;AI 可见度分析是完整版(60-120 秒)。

信噪比低怎么办?

检查是否有大量内联 CSS/JS、冗余 HTML 嵌套、未压缩的第三方脚本。将核心内容用 article 标签隔离。

‘ + GeoAPI.t(‘density.s1’) + ‘
0%
Token 密度 (有效信息占比)
等待分析
成分透视:
有效内容: 0%HTML/JS 代码噪音
📦 原始体积 (Raw Tokens)
0
未清洗的 HTML 代码总消耗
💎 纯净体积 (Clean Tokens)
0
AI 实际可读取的知识净荷
⚠️ 密度过低: 建议精简 HTML 结构、将 CSS/JS 外置,或增加正文文本长度,以提升 AI 抓取效率。