RLHF(基于人类反馈的强化学习)通过人类标注员的偏好排序训练 AI 输出更符合 HHH 原则的回答——Helpful(有帮助:直接回答问题)、Harmless(无害:不传播错误信息)、Honest(诚实:承认不确定性)。这个训练过程让 AI 系统性地偏好客观、直接、有证据的内容。
RLHF 的工作方式
- 给模型一个问题,让它生成多个不同的回答
- 人类标注员对这些回答做偏好排序:”这个最好,这个其次,这个最差”
- 用偏好排序训练一个”奖励模型”——它学会了预测”人类会喜欢什么样的回答”
- 用这个奖励模型反过来训练大语言模型,让它的输出越来越符合人类偏好
三个 H 对 GEO 的实操影响
Helpful(有帮助)→ 直接回答问题不绕弯子
标注员给”直接回答问题”的回答打高分,给”铺垫半天才到正题”的打低分。
GEO 动作: 首段即答案。用户问什么就在首段直接回答,不要”随着行业的快速发展”开头。
Harmless(无害)→ 不夸大、不误导
标注员给客观呈现信息的回答打高分,给夸大事实的打低分。
GEO 动作: “该方法在特定条件下效果显著”比”该方法完美解决所有问题”更受 AI 信任。该说”目前研究尚无定论”的地方不说”已经证实”。
Honest(诚实)→ 承认局限性
标注员给承认不确定性的回答打高分,给”一切尽在掌控”式的回答打低分。
GEO 动作: 标注数据的适用范围和局限性。”以上数据基于 2025 年国内市场,海外市场情况可能不同”——这种诚实的限定反而增加 AI 的信任度。
为什么营销软文在 RLHF 体系中天然吃亏
营销软文的典型特征:不直接回答问题(铺垫太多)、夸大产品效果(”行业领先””独一无二”)、不承认局限性(”完美解决一切需求”)。
这三个特征恰好分别违反了 HHH 的三个原则。AI 不是”讨厌”营销软文,而是它的训练过程决定了它偏好相反风格的内容。
延伸阅读
- 《让AI替你说话:GEO权威指南》第二章 2.5 节
- 《让AI替你说话:GEO权威指南》35 条策略·策略 25″RLHF 对齐·HHH 原则”
常见问题 FAQ
-
HHH 原则是谁制定的?Anthropic 在 2022 年系统提出,但类似理念在 OpenAI 等公司也有体现。已成行业通用对齐目标。
-
无害原则会让 AI 回避某些话题吗?会。涉及医疗、法律、争议性话题时 AI 更谨慎,可能拒绝引用不够权威的来源。这些领域 E-E-A-T 信号特别重要。
-
我的内容怎样才能符合 HHH?有帮助(直接回答),无害(数据准确不误导),诚实(来源可查不夸大)。和 GEO 三要素(权威性、相关性、易读性)高度重合。
