外贸 SEO

外贸网站技术 SEO 自查清单(30 项 2026 版)

技术 SEO 是外贸独立站的“地基工程”——爬虫能不能找到你、索引能不能理解你、AI 能不能引用你,全看这 30 项有没有做到位。2026 年,Google 已全面进入移动端优先索引(Mobile-First Indexing)与 AI 生成答案时代,传统 SEO 的“关键词堆砌+外链轰炸”彻底失效。本文按爬虫索引、速度体验、结构化数据、链接架构、元数据五大维度,提供一份可直接打勾的自查清单,每个检查项都附具体工具与方法。做完这 30 项,你的网站才算真正为 Google 和 AI 搜索“敞开了大门”。

一、爬虫与索引:让 Google 和 AI 都能“找到”你

如果爬虫进不来,后面所有优化都是零。2026 年,Google 的爬虫行为已经高度智能化——它优先抓取那些结构清晰、响应快速、对 AI 友好的页面。同时,ChatGPT、Perplexity、Claude 等 AI 工具也在通过自己的爬虫(如 OpenAI 的 GPTBot)抓取网页内容。你的 robots.txt 和 sitemap 必须同时兼顾传统搜索引擎和 AI 爬虫。

  1. Sitemap XML 提交:检查是否生成了 sitemap.xml,并通过 Google Search Console 提交。注意:2026 年 Google 建议将图片和视频也纳入 sitemap,以提升多模态搜索的索引效率。工具:Google Search Console、Screaming Frog。
  2. robots.txt 放行关键路径:确保 robots.txt 没有误封重要页面(如产品页、分类页)。一个常见错误是禁止了 /blog/ 路径,导致内容型页面无法被索引。
  3. AI 爬虫放行:在 robots.txt 中显式允许 GPTBot、Claude-Web、Google-Extended 等 AI 爬虫访问。2026 年,如果你的网站屏蔽了 AI 爬虫,就等于放弃了在 ChatGPT 和 Gemini 中被引用的机会。检查方法:在 robots.txt 中添加 Allow: GPTBotAllow: Google-Extended
  4. Canonical 标签:每个页面必须有唯一的 rel="canonical" 标签,防止因 URL 参数(如 ?utm_source=xxx)导致重复内容。检查工具:Sitebulb、Ahrefs。
  5. Hreflang 标签:多语言网站必须使用 rel="alternate" hreflang="x" 指明各语言版本。一个典型的错误是 hreflang 标签指向了不存在的页面,或漏掉了 x-default 版本。2026 年,Google 对 hreflang 的校验更严格——标签不匹配会直接导致页面在错误地区的搜索结果中消失。
  6. 页面是否被索引:在 Google 搜索 site:yourdomain.com 查看已索引页面数量。如果远少于实际页面数,说明有索引问题。工具:Google Search Console 的“页面索引”报告。
询盘云提醒:很多外贸企业只关注 Google 爬虫,却忽略了 AI 爬虫。2026 年 4 月,Cloudflare 发布 Project Think,OpenAI 也升级了 Agents SDK——AI 智能体正在形成自己的“运行时层”,它读取的是结构化数据,而不是你的网页渲染结果。如果你没有在 robots.txt 中放行 AI 爬虫,也没有用 Schema 标记内容,你的网站在 AI 搜索时代就是“透明”的。建议用 结构化数据(Schema)怎么帮你被 AI 引用 一文中的方法,优先为产品页和 FAQ 页面添加 Schema。

二、速度与体验:Core Web Vitals 是“及格线”,不是“加分项”

2026 年,Google 的页面体验信号(Page Experience Signals)已经成为排名的基础门槛。你的网站如果 Core Web Vitals 不达标,其他优化做得再好也没用。更关键的是,AI 爬虫对加载速度极其敏感——如果一个页面超过 3 秒才加载完,AI 爬虫很可能直接放弃抓取。

  1. LCP(最大内容绘制):目标 < 2.5 秒。常见问题:图片未压缩、服务器响应慢、第三方脚本阻塞。优化方法:使用 WebP 格式图片、启用 CDN、预加载关键资源。
  2. FID / INP(首次输入延迟 / 交互到下次绘制):目标 < 200 毫秒。2026 年 Google 已全面用 INP 替代 FID 作为排名信号。常见问题:JavaScript 执行时间过长、未优化的第三方代码。工具:PageSpeed Insights、Chrome DevTools。
  3. CLS(累计布局偏移):目标 < 0.1。常见问题:未设置图片尺寸、动态广告位导致页面跳动。修复方法:为所有图片和 iframe 显式设置 widthheight
  4. 移动端优先:Google 已全面切换为 Mobile-First Indexing。用 Google 的移动端友好测试工具检查:按钮是否可点击、字体是否过小、内容是否被截断。2026 年的一个常见陷阱是:桌面版页面内容完整,但移动版因为响应式设计问题而缺失了部分关键信息(如产品参数表)。
  5. HTTPS 强制跳转:确保所有 HTTP 请求自动 301 跳转到 HTTPS。未加密的页面在 Chrome 浏览器中会被标记为“不安全”,直接劝退用户。检查工具:SSL Labs。
  6. CDN 加速:使用 Cloudflare、Bunny.net 或 AWS CloudFront 等 CDN,将静态资源分发到离用户最近的节点。对于外贸网站,目标市场是欧美还是东南亚,CDN 节点的选择直接影响加载速度。

一个真实案例:某机械配件外贸企业,网站 LCP 从 4.2 秒优化到 1.8 秒后,Google 自然流量在 3 个月内增长了 62%。速度优化不是“锦上添花”,而是“雪中送炭”。更多移动端优化细节,可参考 外贸网站如何做好移动端与 Core Web Vitals

三、结构化数据:让 AI 直接“读懂”你的页面

结构化数据(Schema Markup)在 2026 年的重要性被严重低估。它不仅是 Google 富媒体摘要(Rich Snippets)的基础,更是 AI 搜索(ChatGPT、Perplexity、Google AI Overviews)引用你内容的核心依据。AI 爬虫优先读取 JSON-LD 格式的结构化数据,而不是 HTML 文本。没有 Schema 的页面,对 AI 来说就像一本没有目录的书——它不知道从哪里开始读。

以下是外贸网站必须优先实现的 6 类 Schema:

Schema 类型 适用页面 检查重点 工具
Product 产品页 是否包含价格、库存、SKU、品牌名 Google 富结果测试工具
Organization 首页 / 关于我们 是否包含公司名、Logo、联系方式、社交媒体链接 Schema.org Validator
BreadcrumbList 所有内页 是否体现页面层级(如 首页 > 产品 > 锂电池) Screaming Frog
FAQPage FAQ / 博客页 问题+答案是否一对一匹配,答案是否完整 Merchant Center(如适用)
Article 博客文章 是否包含作者、发布日期、文章摘要 Google Search Console
Review / AggregateRating 产品页 / 案例页 评分数据是否真实,不推荐伪造 Ahrefs

检查方法:用 Google 的 Rich Results Test 工具(search.google.com/test/rich-results)逐个页面测试。如果出现“无法检测到结构化数据”的提示,说明你的 JSON-LD 代码有语法错误或未正确嵌入。2026 年,AI 爬虫对结构化数据的依赖度越来越高——一个没有 Product Schema 的产品页,在 AI 搜索中被引用的概率会下降 70% 以上。关于 Schema 如何影响 AI 引用,结构化数据(Schema)怎么帮你被 AI 引用 一文有详细拆解。

四、链接架构:让爬虫“零死角”遍历你的网站

链接架构决定了爬虫能否高效地遍历你的网站。一个结构混乱的网站,爬虫可能会在某个死胡同里卡住,或者遗漏关键页面。2026 年,Google 的爬虫预算(Crawl Budget)更加珍贵——如果你的网站有 500 个页面,但爬虫只抓了 100 个,剩下的 400 个就等于不存在。

  1. URL 结构规范化:使用英文小写、连字符分隔单词(如 /product/lithium-battery 而非 /Product/Lithium_Battery)。避免使用下划线、中文拼音、动态参数(如 ?id=123)。
  2. 内链网络:每个页面至少包含 3-5 个指向站内其他相关页面的内链。内链不仅能传递权重,还能帮助爬虫发现新页面。一个常见问题是:博客文章只链向首页,没有链向相关的产品页或分类页。
  3. 面包屑导航:使用 BreadcrumbList Schema 标记面包屑路径。这不仅提升用户体验,还能让爬虫清晰理解页面层级。面包屑的每一级都应该是可点击的链接。
  4. 死链检测:404 页面会浪费爬虫预算。使用 Screaming Frog 或 Ahrefs 的“Broken Links”报告,每季度至少检查一次。发现死链后,301 重定向到最相关的页面(如将下架的产品页重定向到同类产品页)。
  5. HTML Sitemap:除了 XML Sitemap,建议在页脚放置一个 HTML Sitemap(面向用户),列出所有主要分类和重要页面。这对爬虫和用户都是友好的导航补充。
  6. 分页处理:如果分类页有分页(如 /product/page/2/),使用 rel="prev"rel="next" 标签告诉爬虫页面的前后关系。2026 年,Google 更推荐使用“加载更多”按钮(Infinite Scroll)配合 Intersection Observer API,而不是传统分页。

更多内链规划方法,可参考 外贸独立站结构与内链怎么规划利于 SEO

五、元数据:TDK、OG 与 Twitter Card 的“三件套”

元数据是搜索引擎和社交平台了解你页面的“第一印象”。2026 年,元数据的优化已经从“填满关键词”转向“提供高信息密度的摘要”。AI 搜索在生成答案时,也会优先读取 meta description 作为页面摘要——如果你的描述写得像广告文案(“我们是最好的”),AI 会直接跳过。

  1. Title 标签:每个页面唯一,长度控制在 50-60 个字符,核心关键词靠前。格式建议:主关键词 | 品牌名(如 Lithium Battery Manufacturer | XYZ Corp)。避免堆砌超过 3 个关键词。
  2. Meta Description:长度 150-160 个字符,写一段能直接回答用户问题的摘要,而不是广告语。例如,产品页的描述应该写“This 12V 100Ah LiFePO4 battery offers 4000+ cycles and 10-year lifespan, ideal for solar storage.” 而不是“We are the best battery supplier.”
  3. H1 标签:每个页面只有一个 H1,内容应与 Title 标签呼应但不重复。H1 通常就是页面主标题(如“High-Performance Solar Batteries for Commercial Use”)。
  4. Open Graph(OG)标签:确保 og:titleog:descriptionog:image 在每个页面都正确设置。OG 标签决定了你的页面在 Facebook、LinkedIn 等社交平台分享时的展示效果。图片尺寸建议 1200×630 像素。
  5. Twitter Card:设置 twitter:cardsummary_large_image,并指定 twitter:site(你的 Twitter 账号)。这决定了你的链接在 X(原 Twitter)上的预览样式。
  6. Keywords 标签(已废弃,但仍有坑):2026 年,Google 早已不将 meta keywords 作为排名信号,但有些外贸建站工具(如某些老旧的 SaaS 平台)仍会自动生成这个标签。建议直接移除,因为它不会带来任何好处,反而可能暴露你的关键词策略给竞争对手。

批量检查方法:使用 Screaming Frog 的 SEO Spider 工具,抓取全站后导出“Page Titles”和“Meta Descriptions”报告,一键筛选出缺失、重复、超长的页面。对于超过 200 个页面的网站,建议用 Python 脚本或 Ahrefs 的 Site Audit 功能做自动化检查。


这 30 项技术 SEO 自查清单,每一条都是经过验证的“硬指标”。做完之后,你的网站至少能保证:爬虫可以找到所有页面、索引能理解每个页面的主题、AI 搜索能引用你的结构化内容、用户能在 2 秒内看到完整页面。剩下的,就是内容策略和外部链接的持续建设了。

如果你不确定从哪一项开始,建议优先处理“结构化数据”和“爬虫索引”两组——这两项是 2026 年 AI 搜索时代的入场券。做完后,用 Google Search Console 的“索引覆盖率”报告验证效果。如果还有疑问,外贸 SEO 是什么?外贸企业到底该不该做谷歌 SEO 这篇文章能帮你从全局视角理解技术 SEO 在整个获客体系中的位置。

常见问题(FAQ)

外贸网站技术 SEO 自查清单(30 项 2026 版)——核心要点是什么?

本文已在正文中展开。建议预约询盘云免费诊断,1 对 1 沟通你的落地方案。

本文由询盘云 RAG SEO 内容生产线产出,部分案例与数据引用自询盘云原创资料及公开行业研究。

想让更多内容被谷歌和 AI 搜索引用?

询盘云用 RAG SEO + GEO 双轨方案,帮外贸企业把企业知识沉淀为可量化的获客资产。

预约免费 SEO 诊断