真正有效的 SEO 修复:Canonical、Sitemap 与尾部斜杠
Canonical URL 不一致性
Canonical 标签告诉搜索引擎当同一内容存在多个 URL 时应该索引哪个版本。当 canonical 标签指向与页面实际 URL 不同的 URL 时,会出现问题——这比你想象的更常见。
常见的不一致来源:带和不带尾部斜杠的 URL(/page vs /page/)、带和不带 www 的版本、以及自引用 canonical 与规范版本不完全匹配的情况。
Sitemap 过滤
Sitemap 告诉搜索引擎存在哪些页面。包含不应被索引的 URL——分页路由、过滤器参数、测试环境 URL——会稀释 sitemap 信号并导致爬虫资源浪费在低价值页面上。
修复是实现 sitemap 生成时的过滤,明确排除以下内容:/api/ 路径、带有查询参数的 URL(除非它们代表独立页面)、以及已知的低质量或重复路由。
尾部斜杠处理
这是造成最多无意重复内容问题的单一配置决策。/blog 和 /blog/ 是对搜索引擎来说不同的 URL,除非明确处理。
解决方案是选择一种约定(我们选择不带尾部斜杠)并强制执行:Nginx 规则将所有尾部斜杠重定向到不带斜杠的版本,canonical 标签始终使用不带斜杠的形式,sitemap 一致使用不带斜杠的版本。
实际排名影响
规范化这三个方面后,三个月内 Google Search Console 中的已索引页面数量增加了约 23%。更重要的是,具有重复问题的页面的点击率提高了——搜索引擎现在可以可靠地将权重归因于正确的 URL 版本。