严潇健
互联网引流变现最靓的仔

让百度蜘蛛告别 5 B 空体 —— 非 www 统一跳转与实体大小检查全记录

适用场景:WordPress、宝塔、Nginx,想提升百度抓取预算、解决“200 状态但 Content-Length=5 B”空体问题。

一、背景:为什么一定要统一域名

  1. 百度蜘蛛对 301 链 + 空体 极度敏感,会判定“低质量”而压缩预算。
  2. WordPress 自己发的 301 默认只带 5 B HTML,造成日志里“200+5 B”假象。
  3. 统一域名后,Nginx 原生 301(≈162 B)+ 后续 200 页面实体 ≥20 KB,蜘蛛才认为“有更新”。

二、DNS 与后台“三一致”原则

项目 推荐值 说明
DNS 解析 只解析 www.example.com 另一条干脆不解析,彻底杜绝双域名
宝塔绑定 同样只填 www.example.com 避免面板生成两套证书
WP 后台地址 https://www.example.com 与绑定域名完全一致,别让程序再 301
口诀:解析一条、绑定一条、后台写一条。

三、Nginx 配置:一行 return 搞定

在宝塔 “网站 → 设置 → 配置文件”server{} 最顶部插入:
# 非 www 统一跳转到 www
if ($host = 'example.com') {
    return 301 https://www.example.com$request_uri;
}
注意
  • 域名后不要加 /,否则出现双斜杠 404。
  • 保存后 重载 Nginx (nginx -t && nginx -s reload)。

四、验证跳转 & 实体大小

1. 确认 301 由 Nginx 发出,无 5 B 空体

curl -I https://example.com/任意文章.html

预期:

HTTP/1.1 301 Moved Permanently
Location: https://www.example.com/任意文章.html
Content-Length: 162

2. 确认蜘蛛 UA 能拿到 ≥20 KB 实体

curl -s -A "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" \
     "https://www.example.com/任意文章.html" | wc -c
≥20 000 即合格;若仍 <10 KB,继续排查缓存插件或主题 exit。

评论 抢沙发

评论前必须登录!

 

登录

找回密码

注册