Logprobs(对数概率)是 AI 在生成每个 Token 时输出的置信度分数——数值越高(越接近 0),AI 对这个词的选择越有信心;数值越低(越负),AI 越不确定。通过分析 Logprobs,可以判断 AI 在回答中对哪些信息”最有把握”、对哪些信息”在猜”。
通俗理解
想象你让 AI 写一篇关于你品牌的介绍。AI 写出来了一段话,每个词上面都飘着一个”信心分数”。
“XX 品牌” → 信心 95%(AI 很确定这个品牌存在)
“成立于” → 信心 90%
“2018 年” → 信心 40%(AI 不太确定是哪一年)
“专注于实验室仪器” → 信心 85%
那个 40% 的”2018 年”就是 AI 最可能出错的地方——它不确定,但还是写了一个数字。这就是幻觉的来源。
Logprobs 就是让你看到这些隐藏的”信心值”。
技术原理
在 API 调用中(如 OpenAI 的 API),你可以设置 logprobs=true 来获取每个生成 Token 的对数概率。
- Logprob = 0: 概率 = 100%,AI 完全确定
- Logprob = -0.1: 概率 ≈ 90%,AI 非常有信心
- Logprob = -1.0: 概率 ≈ 37%,AI 有些不确定
- Logprob = -3.0: 概率 ≈ 5%,AI 在”猜”
数值是对数概率(ln(p)),所以都是负数或零。越接近 0 越确定。
这和 GEO 有什么关系
Logprobs 对 GEO 从业者的价值主要在诊断层面:
诊断 AI 对你品牌的认知度
通过 API 让 AI 生成关于你品牌的回答,检查品牌名称出现时的 Logprobs。如果你的品牌名 Logprob 很低(比如 -3.0),说明 AI 对你的品牌”不熟悉”——参数化记忆中存在感很弱,需要加强多源分发。
识别幻觉风险
如果 AI 在回答中提到了你的产品参数,但该 Token 的 Logprob 很低,说明 AI 对这个数据不确定——很可能是”编的”。这提醒你需要在内容中提供更明确、更容易被检索到的数据,减少 AI “猜测”的必要。
评估内容的”可复述性”
让 AI 复述你的答案块内容,对比 Logprobs。如果复述过程中大部分 Token 的 Logprob 都较高(>-0.5),说明你的内容”复述友好”——AI 在复述时阻力小、忠实度高。如果 Logprob 普遍较低,说明你的表述方式对 AI 来说”不自然”,需要简化。
使用限制
Logprobs 需要通过 API 访问,大多数 AI 产品的用户界面不直接展示。它更适合有技术能力的 GEO 从业者或团队使用。
但即使你不直接使用 Logprobs,理解这个概念也有价值:它提醒你 AI 的每一个输出都有一个”信心值”,你的 GEO 优化目标就是让 AI 在引用你的内容时信心值尽可能高。
延伸阅读
- 《让AI替你说话:GEO权威指南》第二章 2.5 节
- 《让AI替你说话:GEO权威指南》第八章”GEO 效果监测”中关于 API 自动化检测的部分
- GEOBOK 免费工具:AI 品牌印象诊断
常见问题 FAQ
-
Logprobs 是公开可查的吗?部分可查。OpenAI API 提供 logprobs 参数。但消费级产品(ChatGPT 网页版)不直接展示。
-
高 Logprob 值意味着什么?意味着模型对该 Token 选择非常有信心。如果 AI 引用你时 logprob 很高,说明你的内容是该话题的高概率答案。
-
Logprobs 对 GEO 监测有什么价值?可用 API 让 AI 回答目标问题,查看 logprobs 判断 AI 对引用你的内容有多确定。稳定偏高说明内容优势明显。
