我给自己的出海博客做了一次 GEO 审计,AI 爬虫接近满分,但总分 42

I ran a GEO audit on my blog and scored 42/100 despite 95/100 AI crawler access. The root cause: Chinese-only content that AI systems couldn't cite. Five hours of fixes brought the score to 65.

我给自己的出海博客做了一次 GEO 审计,AI 爬虫接近满分,但总分 42

为了更好掌握GEO,我在我的博客 adamnote.com 上做了些GEO优化测试。在 AI 爬虫接入这一项拿了 95 分(满分 100),排在前 5%。

总分:42。评级:Weak。

门开着,灯亮着,货架摆满了——但标签全是顾客看不懂的语言。

这是我给自己做 GEO(Generative Engine Optimization)审计后的核心发现。也是大多数中国出海品牌正在犯、但没意识到的结构性错误。

GEO 在测什么

GEO 不是 SEO 换了个名字。

SEO 优化的是搜索引擎的排名算法。GEO 优化的是 AI 系统的引用决策——ChatGPT、Perplexity、Google AI Overviews 在回答用户问题时,选择引用谁。

几个数据:

  • Google 搜索中 60% 以零点击结束,用户在搜索结果页就得到了答案
  • 品牌被提及的频率与 AI 搜索可见度的相关性,是反向链接的 3 倍
  • 目前不到 5% 的网站有 llms.txt 文件

传统 SEO 那套”做好内容等着被搜到”的逻辑正在失效。AI 不是在搜索你的内容,它是在判断你的内容值不值得引用。

GEO 审计量化的就是这个”值不值得引用”。维度包括:AI 爬虫能不能访问、内容结构能不能被引用、Schema 标记是否完整、E-E-A-T 信号是否充足、各 AI 平台的兼容度。

完美接入背后的语言黑洞

回到 95 分和 42 分的矛盾。

问题根源出奇地简单:我的博客是纯中文的。

一个写给中国出海从业者看的博客,当然是中文的。但 AI 搜索不这么看。

ChatGPT 背后是 Bing 的索引。Google AI Overviews 背后是英文优先的语言模型。Perplexity 的引用来源以英文内容为主。一个英语用户问”What are common ad mistakes for Chinese brands going overseas?“,AI 几乎不可能引用一篇中文文章来回答。

语言之外还有一堆基础设施缺失。HTML lang 属性没设置,AI 连语言都识别不了。没有 llms.txt,AI 不知道站点做什么的。没有 Person 和 Organization 的 Schema 标记,E-E-A-T 信号为零。About 页面没有作者资质。没有 FAQ Schema,Google AIO 触发不了。没提交 Bing Webmaster Tools,对 ChatGPT Search 完全隐身。

AI 爬虫可以完美访问的,是一堆它无法利用的内容。

从 42 到 65

分两轮修。

第一轮:基础修复(约 2 小时)

  1. 设置 HTML lang 属性
  2. 创建 llms.txt,描述站点定位和核心内容
  3. 添加 Person + Organization Schema
  4. 重写 About 页面,补充行业经验和资质
  5. 为核心文章添加 FAQ Schema
  6. 提交 Bing Webmaster Tools
  7. 建立中英双语架构,发布第一篇英文内容
  8. 注入 hreflang 标签实现中英互指

第二轮:深度修复(约 3 小时)

  1. Ghost 主题 H1 修复(Casper 默认用 h2 渲染标题,改两行代码解决 18 个 SEO 问题)
  2. 批量补全 15 个 tag 页面的 meta description 和 cover image
  3. 合并双作者账户,迁移 9 篇文章
  4. 添加 SpeakableSpecification Schema(告诉 AI 哪些段落可以直接引用)
  5. 修复 /en/ 页面的语言标记(英文内容被错误标记为中文)

重新审计:65/100,从 Weak 进入 Moderate 上段。

各 AI 平台的分项得分:

平台 得分
Google AI Overviews 68
Gemini 66
Perplexity 52
ChatGPT 48
Bing Copilot 44

垫底的是 ChatGPT 和 Bing Copilot。它们共用 Bing 索引,而 Bing 还没爬完我大部分页面。这是最容易修的短板:强制重新提交、补充英文内容,分数就会上来。Google 系得分最高,因为 Google 对 Schema 标记响应最快。Perplexity 的情况不太一样,它的瓶颈不在技术层,而在外部引用——它偏爱被 Reddit/Quora、学术论文等第三方来源交叉验证过的内容。这靠的是时间和声誉积累,不是代码能解决的。

五个小时,23 分。更重要的是,这些时间暴露出的问题,在我之前的认知里根本不存在。

57 个问题,7 个根因

修完 GEO 基础项后,我用 Ahrefs 做了一次 Site Audit 作为外部验证。

报告显示 57 个问题。

我没有逐条修。把三份 CSV 导出做了交叉比对,57 个”问题”映射到 22 个独立页面,背后只有 7 个根本原因。

一个典型的例子:Ghost 的 Casper 主题把文章标题渲染为 <h2> 而不是 <h1>。这一个 bug 制造了 18 条 Ahrefs 记录。改两行代码全消。

其他几个根因同样是一改多消:

  • 15 个 tag 页面缺 meta description 和 cover image → 一个批量脚本补全
  • 双作者问题 → 合并为一个
  • /en/ 路径下的孤页 → 修 routes.yaml 路由

最终 Ahrefs issues 从 57 降到 5-8 个,剩下的是 Ghost 平台本身的结构性限制。

面对一长串问题清单,先找根因再动手。 同一个根因会伪装成十几个不同的”问题”。

出海品牌应该在意

我的博客只是个人站点,利害关系不大。但同样的问题放到出海品牌官网上就不一样了。

一个中国消费电子品牌,SEO 做得不错,Google 自然排名也有。美国用户对 ChatGPT 说”recommend a good robot vacuum under $300”,AI 的回答里没有这个品牌。

产品没问题。问题在于:

  • 英文内容不够”可引用”,段落太长,缺乏直接回答用户问题的结构
  • 没有 Schema 标记,AI 无法快速提取品牌信息和产品参数
  • 在 Reddit、Quora 等 AI 高权重引用源上没有品牌存在——Reddit 贡献了 Google AIO 引用来源的 21%,Quora 贡献了 14.3%
  • 没有 llms.txt

过去出海的逻辑是”翻译成英文,做 SEO,投广告”。AI 搜索的逻辑不一样:你的内容不只要被找到,还要被引用。

被找到是排名问题,花钱能推。被引用是内容结构问题,花钱推不动。

优先级

现在就做:

  • 检查 HTML lang 属性
  • 创建 llms.txt 文件
  • 补全 Schema 标记(Organization、Person、Product、FAQ)
  • 提交 Bing Webmaster Tools
  • 核心产品页加清晰的英文 FAQ 段落

接下来做:

  • 在 Reddit、Quora 上建立品牌内容
  • 英文内容从”翻译思维”转向”可引用思维”——短段落、直接回答、结构化
  • 建立品牌提及监测

不急:

  • 不需要重建网站
  • 不需要放弃 SEO
  • 不需要用 AI 批量生产英文内容

GEO 是在现有基础上加一层 AI 可读性。像十年前给网站加移动端适配,不是革命,是升级。

出海品牌在这件事上的窗口期不会太长。竞争对手还没搞清楚 llms.txt 是什么的时候,把基础打好,就是先发优势。

42 到 65,五个小时。

FAQ

GEO 和 SEO 有什么区别?

SEO 优化搜索引擎排名,GEO 优化 AI 系统的引用决策。AI 不是给你排名,而是判断你的内容值不值得引用。两者可以并行,GEO 是在 SEO 基础上的升级。

llms.txt 是什么?怎么创建?

llms.txt 是一个放在网站根目录的文本文件,用结构化格式告诉 AI 你的站点是做什么的、核心内容有哪些、作者是谁。目前不到 5% 的网站有这个文件,创建一个就能领先大多数竞争对手。

中文网站是否完全无法被 AI 引用?

不是完全不能,但机会大幅减少。ChatGPT、Perplexity、Google AI Overviews 的引用来源以英文为主。中文网站需要至少有英文 FAQ 段落和英文摘要,才能进入英文 AI 查询的引用范围。

GEO 审计需要多少时间和成本?

基础审计和修复大约需要 5 小时,主要是设置 Schema 标记、创建 llms.txt、提交 Bing Webmaster Tools 等技术操作。不需要重建网站,也不需要额外预算。

哪些 AI 平台对出海品牌最重要?

Google AI Overviews 覆盖面最广(1.5B 月活用户),ChatGPT 影响力最强(9 亿周活),Perplexity 增长最快。三个平台的引用逻辑不同,但都要求内容可被结构化提取、有第三方交叉验证。

English Summary

A GEO audit of adamnote.com revealed a 42/100 score despite 95/100 AI crawler access. The core problem: the site was Chinese-only, making it invisible to English-language AI citation systems like ChatGPT, Perplexity, and Google AI Overviews. Structural gaps included missing HTML lang attributes, no llms.txt, no Person or Organization schema, and no Bing Webmaster Tools registration. Two rounds of fixes over five hours raised the score to 65/100. Google AI Overviews scored highest at 68, while ChatGPT and Bing Copilot lagged at 48 and 44 due to slow Bing indexing. A separate Ahrefs audit flagged 57 issues that traced back to just 7 root causes. For Chinese brands going overseas, the lesson is clear: AI search visibility requires content structured for citation, not just translation and SEO.