Question 1

用这个工具检查我网站的 HTTP 头部，数据来源是哪里的？我实时抓的包和这里显示的不一样怎么办？

Accepted Answer

这个工具是纯浏览器端（FE）实现的，数据来源就是当前浏览器实际发起的请求和收到的响应头。如果你用工具检查自己的网站，结果等于你的浏览器访问该网站时接收到的头部。与服务器端抓包（如 curl -I）或第三方监测工具不一致是正常的——因为 CDN 节点、浏览器、用户代理、Cookie 等因素都会影响响应头。例如，同一个 URL，用 Chrome 访问可能返回 Cache-Control: public，用 curl 可能没有。建议以服务器端日志或 curl 的输出为准，浏览器端的头部仅代表当前用户的真实体验。

Question 2

工具能检测 X-Robots-Tag 设置得对不对吗？比如我设了 noindex，但 Google 还是收录了。

Accepted Answer

工具只展示当前请求返回的 X-Robots-Tag 原始值，不判断“对不对”。如果设了 noindex 仍然被收录，常见原因包括：1) 该指令只影响索引，不影响抓取，Google 仍可能先抓取再在索引中移除，有延迟；2) 其他来源（如 sitemap、外链）触发了抓取，但头部指令生效需要 Googlebot 重新访问；3) 指令拼写错误（如 noindex 写成 noindexx）或大小写问题（X-Robots-Tag 值不区分大小写，但建议用小写）。可以用本工具检查当前响应头是否真的返回了 X-Robots-Tag: noindex。

Question 3

为什么我输入同一个网址，每次查到的 Cache-Control 都不一样？

Accepted Answer

这是正常现象，原因主要有三个：1) 网站可能对同一 URL 设置了基于用户身份的差异化缓存策略（登录态 vs 未登录）；2) 浏览器请求头中的 Cache-Control（如 max-age=0）会覆盖服务器响应逻辑，某些服务器会据此返回不同的 max-age；3) 如果网站使用了动态内容缓存（如 Varnish、Cloudflare），首次访问可能返回 MISS（无缓存），后续返回 HIT（命中缓存），两者的 Cache-Control 可能不同。本工具展示的是你当前浏览器真实收到的值，多次查询结果不同说明缓存策略是动态的。

Question 4

这个工具能帮我检查 canonical 标签是不是写错了？比如我写了 A 页面的 canonical 是 B，但 B 页面又 canonical 到 C。

Accepted Answer

工具会展示响应头中的 Link: rel=canonical 值（如果有的话），但只能看到当前页面的 canonical 声明，无法追踪“链式 canonical”或检查循环引用。要诊断这种问题，需要分别查询 A、B、C 三个页面的响应头。如果 A 的 canonical 指向 B，B 的 canonical 指向 C，C 的 canonical 指向 A，这就是一个循环 canonical，搜索引擎会忽略所有声明。本工具适合快速单页检查，循环检测需要手动多步查询。

Question 5

工具显示某个头部是“自定义头部”，这正常吗？我网站没设置过这个东西。

Accepted Answer

“自定义头部”是指非标准 HTTP 头部（即不在 IANA 注册表中的头部名称）。很多中间件、CDN、安全插件、Web 服务器会自动添加自定义头部。例如：X-Cache（来自 CDN）、X-Content-Type-Options（来自安全配置）、X-Frame-Options（来自网站框架）、Server（来自 Web 服务器）。即使网站代码里没写，服务器软件或托管平台也可能默认加上。如果是 X- 开头的头部，通常是安全的扩展头部，不影响功能。如果看到奇怪的名称（如 X-MySecretFlag），建议检查服务器配置是否有意外注入。

Question 6

为什么我查百度首页，结果里没有 X-Robots-Tag？是不是工具坏了？

Accepted Answer

不是工具问题。百度首页没有返回 X-Robots-Tag 头部，这是正常的——该头部是可选的，只在需要覆盖 robots.txt 规则时使用（例如对 PDF 文件设 noindex，对广告落地页设 nofollow）。大多数普通网页不会设置 X-Robots-Tag，搜索引擎会直接使用 <meta name=robots> 或默认规则。本工具如实显示响应头中实际存在的内容，没有就是没有，不代表工具异常。你可以用这个工具查一下自己的网站，如果也没有，说明不需要通过头部控制抓取/索引。

Question 7

这个工具和浏览器开发者工具（F12 的 Network 面板）有什么区别？我直接用 F12 不就行了？

Accepted Answer

核心区别在于聚焦和速度。F12 的 Network 面板会列出所有请求（图片、CSS、JS、XHR），头部信息分散在几十个请求中，找单个 URL 的响应头需要筛选。本工具专门针对“查看一个 URL 的 HTTP 头部”这个场景优化：输入 URL → 一键查询 → 只展示该 URL 的响应头和请求头，按功能分组（缓存、SEO、安全、内容协商等），并自动高亮常见 SEO 相关头（X-Robots-Tag、canonical、Cache-Control）。适合快速检查，特别是做 SEO 审计时逐个页面查头部，比 F12 逐条翻效率高。但 F12 能查看请求时间线、Cookie 详情、WebSocket 等，本工具做不到。

维度	本工具	竞品 A (Screaming Frog SEO Spider)	传统方法
数据隐私	纯浏览器处理，HTTP 响应头仅在本地解析，无数据上传	需将网页 URL 列表导入桌面软件，数据存储在本地电脑	手动检查每个 URL，依赖个人对响应头知识的掌握
处理速度	单次查询即时返回（<1秒）	爬取整个网站后批量分析，速度取决于网站规模和网络带宽	逐个 URL 手动查看浏览器开发者工具，耗时数分钟至数小时
离线可用	完全离线，无需网络连接（页面加载后）	需要网络连接以爬取网站	完全离线，但依赖浏览器缓存或已保存的请求
使用门槛	无需安装，打开网页即用	需要下载安装桌面软件，学习配置爬取规则	需要熟悉浏览器开发者工具（Network 面板）和 HTTP 协议基础
批量处理	单次仅处理一个 URL	支持批量爬取整个网站（数千个 URL），生成结构化报告	无法批量，只能逐一手动检查
分析深度	仅展示当前 URL 的原始响应头	可提取并过滤所有 URL 的响应头，支持高级搜索和导出	依赖个人对响应头字段的理解，容易遗漏或误判关键字段（如 X-Robots-Tag 拼写错误）
适用场景	快速验证单个页面的响应头配置（如检查 canonical 是否正确）	大规模 SEO 审计，批量检查全站 HTTP 头配置一致性	学习或调试单个请求，不适合生产环境下的批量检查

输入	输出	说明
X-Robots-Tag: noindex, nofollow	指令: noindex, nofollow 生效范围: 所有爬虫说明: 禁止索引且禁止跟踪链接	典型场景：SEO 最常用组合，禁止页面被收录
Link: <https://example.com/canonical-url>; rel="canonical"	类型: Link 头关系: canonical 目标 URL: https://example.com/canonical-url 说明: 声明此页面的规范版本地址	典型场景：通过 HTTP 头指定 canonical URL
Cache-Control: public, max-age=3600	指令: public, max-age=3600 缓存策略: 允许公共缓存有效期: 3600 秒（1 小时）	典型场景：静态资源缓存控制，平衡性能与新鲜度
Cache-Control: no-store	指令: no-store 缓存策略: 禁止任何缓存说明: 响应不得存储于任何缓存	边界 case：敏感数据（如支付页面）强制禁用缓存
X-Robots-Tag: unavailable_after: 2025-12-31	指令: unavailable_after 日期: 2025-12-31 说明: 在此日期后爬虫应停止索引此页面	边界 case：限时内容过期后自动移除索引
Cache-Control: no-cache, no-store, must-revalidate	指令: no-cache, no-store, must-revalidate 缓存策略: 完全禁止缓存说明: 每次请求都必须向源服务器验证	易错 case：no-cache 并非不缓存，需配合 no-store 才完全禁用
X-Robots-Tag: none	指令: none 等效于: noindex, nofollow 说明: 禁止索引且禁止跟踪链接	易错 case：none 是 noindex + nofollow 的简写，非无限制

HTTP Headers 大全

HTTP Headers 大全

Header 列表

关于本工具

使用场景

SEO 审计排查

缓存策略调优

域名迁移重定向

移动端适配验证

对比矩阵本工具 vs 竞品 vs 传统方法

使用指南

使用步骤

输入输出示例7 个典型场景，覆盖常规、边界与易错

常见错误对照8 个常踩的坑 · 错误 → 修复

1. X-Robots-Tag 值拼写错误

2. X-Robots-Tag 同时给多个值但用分号分隔

3. canonical 写成了绝对路径但漏了协议

4. canonical 与页面实际内容不一致

5. Cache-Control 同时出现冲突指令

6. Cache-Control 用 max-age 但忘了设置 s-maxage

7. 把 X-Robots-Tag 写成了 HTML meta 标签格式

8. canonical 引用了带查询参数的 URL 但参数无意义

工作原理

核心公式

变量说明

示例

适用范围

原理图

开发者集成

常见问题

相关工具