同样两个卖烘焙教程的网站。页面上的内容差不多——都写了戚风蛋糕的配方、步骤、注意事项。
但其中一个网站的 HTML 源代码里多了一段东西:
{
"@type": "HowTo",
"name": "戚风蛋糕制作教程",
"step": [
{"text": "蛋黄加20g糖搅拌至发白"},
{"text": "加入40ml牛奶和40ml玉米油"},
{"text": "筛入90g低筋面粉,Z字搅拌"}
]
}这段代码人类访客看不到,但 AI 爬虫看得到。它叫 Schema 结构化数据——相当于你在页面上给 AI 留了一张说明书,直接告诉它:”这个页面是一个教程,分成这几个步骤。”
有了这张说明书,AI 不需要自己从正文里猜”这段内容是步骤还是闲聊”。它能直接提取结构化的信息,高效地整合到回答中。
没有这张说明书的网站呢?AI 只能自己分析正文,效率低、容易漏信息、引用的概率也就低了。
同样的内容,有 Schema 和没有 Schema,对 AI 来说是两种完全不同的处理难度。
Schema 到底是什么?
Schema 是一套由 Google、微软、雅虎等公司共同制定的标准标记语言。它的作用是在 HTML 代码里用结构化的方式描述页面内容的类型和属性。
你在浏览器里看不到它,但搜索引擎和 AI 爬虫能读到。
打个比方:如果你的页面内容是一本书,Schema 就是贴在书脊上的分类标签。图书管理员(AI)拿到一本没贴标签的书,需要翻开来读才能判断它讲什么;拿到一本贴了标签的书,一眼就知道该放在哪个书架上。
Schema 的实现方式主要是 JSON-LD——一段放在 HTML <head> 或 <body> 里的 JSON 代码。不影响页面的视觉显示,只给机器读。
哪些 Schema 类型对 GEO 最有用?
Schema 的类型有几百种,但对 GEO(让 AI 引用你的内容)来说,真正重要的大约十种:
FAQPage(常见问题)。 这是 GEO 价值最高的 Schema 类型。你在页面上写了一组问答,用 FAQPage Schema 标记后,AI 可以直接提取每一对问答。当用户向 AI 问一个恰好匹配你 FAQ 中某个问题的问题时,AI 引用你的概率显著提升。
Article(文章)。 告诉 AI 这个页面是一篇文章,包括标题、作者、发布时间、修改时间。AI 在判断内容的时效性和权威性时会参考这些信息。
HowTo(教程/步骤)。 如果你的页面内容是”怎么做XX”这类教程,HowTo Schema 让 AI 能直接提取出分步骤的操作指南。
Product(产品)。 标记产品名称、价格、评分、库存状态等。当用户问”XX产品多少钱””XX和YY哪个好”时,AI 能直接从 Product Schema 中获取结构化的对比数据。
Organization(组织/公司)。 标记公司名称、地址、联系方式、社交媒体链接。帮助 AI 建立品牌实体的认知——知道你是谁、在哪里、做什么。
LocalBusiness(本地商户)。 对实体门店特别重要——营业时间、地址、电话、服务区域。用户问”附近有什么好的XX店”时,这些信息帮助 AI 定位和推荐你。
Review / AggregateRating(评价/评分)。 标记用户评价和综合评分。AI 在组织推荐类回答时,会倾向引用有评分数据的品牌。
BreadcrumbList(面包屑导航)。 帮助 AI 理解页面在网站中的层级关系。一个标记了面包屑的页面,AI 能更准确地判断它属于哪个品类。
VideoObject(视频)。 如果你的页面嵌入了视频,标记视频的标题、描述、时长。随着多模态 AI 的发展,视频 Schema 的价值正在上升。
WebPage / WebSite。 基础类型,帮助 AI 理解页面的基本属性和站点结构。
你不需要在每个页面上加所有类型。产品页加 Product 和 FAQ,博客文章加 Article,教程页加 HowTo,公司介绍页加 Organization。匹配页面内容的类型即可。
Schema 结构化数据检测:你有什么、缺什么、该加什么
GeoBok 的”Schema 结构化数据检测”工具帮你快速摸清现状。
操作方式:输入一个 URL,系统解析页面的 HTML,提取所有 JSON-LD 和 Microdata 标记,然后给出三层分析:
第一层:你已有的 Schema。 列出这个页面上已经存在的所有 Schema 类型。很多网站的 CMS(WordPress、Shopify 等)或 SEO 插件会自动生成一些基础 Schema,但站长自己可能不知道。先看看你已经有了什么。
第二层:你缺少的推荐类型。 系统会根据页面内容的特征,对照 GEO 推荐部署的 10 种类型,告诉你这个页面应该有但还没有的 Schema。比如你的页面是一个产品介绍页,已经有了 Article Schema 但没有 Product Schema——系统会提示你应该加 Product。
第三层:具体的添加建议。 不只是告诉你”应该加 FAQPage”,还会解释为什么这个类型对 GEO 有帮助,以及大致的实现方式。如果你的页面上有问答形式的内容但没有用 FAQPage Schema 标记,系统会建议你把这些问答包装成 FAQ Schema。
加了 Schema 效果有多大?
老实说,Schema 不是万能的。加了 Schema 不等于 AI 一定会引用你。AI 引用内容的核心因素还是内容本身的质量——语义匹配度、信息密度、权威性。
但 Schema 做的是另一件事:降低 AI 提取你内容的成本。
没有 Schema,AI 要从非结构化的正文里自己分析”这段话是产品参数””那段话是用户评价””这是一个操作步骤”。这个分析过程有一定的错误率——AI 可能把你的用户评价当成了产品描述,或者没识别出你的内容是一个分步骤的教程。
有了 Schema,这些信息已经被结构化地标记好了。AI 不需要猜,直接拿。效率高了,出错少了,引用你的意愿自然也强了。
类比一下:两份简历投到同一个岗位,内容差不多,但一份排版清晰、分栏明确、关键信息加粗;另一份是一大段不分行的纯文本。HR 更可能仔细看哪一份?Schema 对 AI 的作用,就像好排版对 HR 的作用。
加 Schema 难不难?
对于用 WordPress 的网站,很多 SEO 插件(Yoast、Rank Math、All in One SEO)都支持自动生成 Schema。你只需要在插件设置里开启对应的 Schema 类型,填写必要的字段。
对于自建网站或不用插件的情况,你需要手动在 HTML 里添加 JSON-LD 代码。JSON-LD 的语法不复杂,Google 有免费的结构化数据标记助手可以帮你生成代码。
先用检测工具看看你的页面目前有什么、缺什么,然后按优先级逐步添加。建议的优先级是:FAQPage(对 GEO 价值最高)→ Article / Product(根据页面类型选)→ Organization → 其他类型。
加完后可以用 Google 的富媒体结果测试工具(Rich Results Test)验证代码是否正确,然后再来 GeoBok 重新检测一次,确认 Schema 已被正确识别。
