GEO 常见术语

一句话答案

这是 GEO（生成式引擎优化）领域核心术语的简明定义索引。每个术语用一两句话解释清楚，标注它和 GEO 的关系，并指向知识库中更详细的解读页面。

术语索引

A

ALT 文本（ALT Text） HTML 中为图片提供的文字描述。AI 系统可以直接读取 ALT 文本，但通常无法读取图片中的内容。信息密度高的 ALT 文本相当于在图片位置额外增加了一段可被检索的文字内容。 → 详见：多模态内容的 GEO 优化

Answer Block → 答案块

答案块（Answer Block） 为了最大化 AI 可提取性而构建的内容单元。特征：语义自洽、结论前置、长度可控（经验区间 200-400 中文字）、静态直出。是 GEO 内容优化最核心的概念。 → 详见：什么是答案块，为什么它是 GEO 的核心

B

BM25 一种经典的关键词匹配算法。很多 RAG 系统采用混合检索——向量检索和 BM25 并行运行，取并集后再重排序。合理的关键词布局仍然有价值，但不再是唯一的竞争维度。

C

CLS（Cumulative Layout Shift） 累积布局偏移，Core Web Vitals 三个指标之一，衡量页面视觉稳定性。目标值 < 0.1。

Core Web Vitals Google 用来衡量页面用户体验的三个核心指标（LCP、CLS、INP）。不是 AI 系统的直接评分维度，但异常值往往提示页面存在影响抓取或内容提取效率的底层问题。

E

E-E-A-T（Experience, Expertise, Authoritativeness, Trustworthiness） Google 的内容质量评估框架。GEO 的权威性维度与 E-E-A-T 在信任建设上有不少相通之处——断言式表达、数据增强、来源标注，可以理解为 E-E-A-T 思路在 AI 时代的机器可读化延伸。

Embedding → 嵌入

嵌入（Embedding） 将文本（Token）转化为高维向量（一组数字坐标）的过程。意思相近的词在向量空间中距离也相近，这是语义匹配的技术基础。 → 详见：什么是向量与语义匹配

实体显著性（Entity Salience） 一段内容中，核心知识点与某个品牌或机构实体的关联强度。如果你的内容中没有清晰的品牌归属标注，AI 会把知识点记住但不会和你的品牌绑定。 → 详见：什么是实体显著性，为什么品牌归属必须写清楚

F

FAQPage Schema Schema.org 结构化数据的一种类型，用于标注”问题-回答”结构。高度适配 AI 的提取模式，是 GEO 优先部署的 Schema 类型之一。

G

GEO（Generative Engine Optimization） 生成式引擎优化。通过优化内容的结构、语义和权威性，提升内容在生成式 AI 回答中被引用概率的方法论。 → 详见：什么是 GEO（生成式引擎优化）

GPTBot OpenAI 用于训练数据收集的爬虫标识。与 OAI-SearchBot（用于 ChatGPT 联网搜索实时检索）是不同的爬虫，robots.txt 中需要分别配置。

I

IndexNow 微软和 Yandex 推动的实时 URL 提交协议。页面新增或更新时主动向搜索系统发送通知，比等待爬虫自己发现更快。

INP（Interaction to Next Paint） 交互到下一次绘制，Core Web Vitals 三个指标之一。目标值 < 200 毫秒。

J

JSON-LD 一种在 HTML 中嵌入结构化数据的格式，是部署 Schema.org 标注的推荐方式。

L

lastmod Sitemap 中标注页面最后修改时间的字段。在 AI 搜索场景下是爬虫判断内容新鲜度的重要参考信号。应使用 ISO 8601 完整格式（含日期、时间和时区）。

LCP（Largest Contentful Paint） 最大内容绘制时间，Core Web Vitals 三个指标之一。目标值 < 2.5 秒。

Lost in the Middle（中间迷失） 多项研究观察到的现象：在长上下文场景中，大语言模型对位于中间位置的信息利用效果，往往弱于位于开头和结尾的信息。这是”结论前置”在 GEO 中重要的技术原因之一。 → 详见：什么是注意力机制，为什么结论不能埋太深

O

OAI-SearchBot OpenAI 用于 ChatGPT 联网搜索实时检索的爬虫标识。如果你希望被 ChatGPT 引用但不希望内容被用于模型训练，需要允许 OAI-SearchBot 但屏蔽 GPTBot。

R

RAG（Retrieval-Augmented Generation） 检索增强生成。AI 在回答问题时实时检索外部信息，再基于检索结果生成回答的机制。是 GEO 优化的主战场。 → 详见：什么是 RAG（检索增强生成）

Reranking → 重排序

重排序（Reranking） 向量检索返回候选切片后，对这些切片进行更精细评分和筛选的步骤。是 GEO 在内容层面最直接的发力环节。信息密度高、有数据来源、结论前置的切片在重排序中更有竞争力。

RLHF（Reinforcement Learning from Human Feedback） 基于人类反馈的强化学习。训练后期的对齐技术，会塑造模型偏好客观、直接、有证据支撑的输出风格。你的内容越像一段可信的事实陈述，越容易被 AI 流畅整合进回答。

S

Schema.org 结构化数据 一套标准化的语义标注体系，告诉 AI 和搜索引擎页面中的内容”是什么”——文章、FAQ、产品还是操作步骤。GEO 优先部署的类型：FAQPage 和 Article。 → 详见：Schema 结构化数据在 GEO 中的作用

SSG（Static Site Generation） 静态站点生成。在构建阶段就生成完整的 HTML 页面。解决 JavaScript 渲染问题的方案之一。

SSR（Server-Side Rendering） 服务器端渲染。在服务器端生成完整的 HTML 再发送给客户端。解决 JavaScript 渲染问题的主要方案。

T

Token AI 模型处理文本的最小单位，不等于字也不等于词，是介于两者之间的文本片段。模型有上下文窗口上限（能同时”看到”的 Token 总数）。信息密度（每个 Token 承载多少有效信息）直接影响内容在检索中的竞争力。 → 详见：什么是 Token，它如何影响你的内容竞争力

TTFB（Time to First Byte） 首字节时间。从爬虫发出请求到收到服务器返回的第一个字节的时间。目标值约 200ms，超过 500ms 需要排查。 → 详见：TTFB 首字节时间：AI 爬虫的第一道门槛

V

向量（Vector） 一组由数百到数千个数字组成的坐标，代表一个 Token 或一段文本在语义空间中的位置。意思相近的文本，向量距离也相近——这是 AI 能找到”意思相近”而非”字面相同”内容的技术基础。 → 详见：什么是向量与语义匹配

Z

零点击搜索（Zero-Click Search） 用户提问后直接在 AI 回答或搜索摘要中获得答案，全程没有点击任何链接。品牌曝光不再只依赖流量，而是通过被 AI 引用直接进入用户认知。 → 详见：什么是零点击搜索，它对品牌意味着什么

注意力机制（Attention Mechanism） AI 理解 Token 之间关系的核心机制。它决定了模型在处理文本时如何分配”注意力”——哪些信息被重点关注，哪些被忽略。对 GEO 的直接影响：代词容易造成注意力”陷阱”，结论埋太深容易被忽视。 → 详见：什么是注意力机制，为什么结论不能埋太深

自回归生成（Autoregressive Generation） AI 生成回答的方式：一个 Token 一个 Token 地”接龙”，每次预测下一个最可能的 Token。内容结构复杂、句式拗口会增加”接龙阻力”，导致 AI 复述时信息失真。 → 详见：AI 怎么把你的内容”说出来”