中文问答
为什么 OAI-SearchBot 会被 Cloudflare 返回 403?
如果 robots 已经允许但仍然 403,问题通常在边缘层(WAF、挑战规则、Bot 安全策略),不是 robots 文件本身。
先查这四项
- Cloudflare WAF 事件里是否有
OAI-SearchBot请求被命中规则。 - 是否有自定义防火墙规则按 ASN、地区、路径或风险分数拦截。
- 是否开启了会对非浏览器请求触发 challenge 的策略。
- 对照源站同时间日志,确认请求是否到达源站。
现场排查命令
jq -r 'select(((.request.headers."User-Agent"[0] // "") | test("OAI-SearchBot"; "i"))) | [.ts, .request.uri, .status] | @tsv' /var/lib/caddy/logs/llmsfile-access.log | tail -n 80
curl -I https://yourdomain.com/robots.txt
curl -I https://yourdomain.com/sitemap.xml
实操结论
若 /robots.txt、/sitemap.xml 这类基础路径持续出现 403,应先修 Cloudflare 边缘策略,再看内容策略。
如果开启了 Bot Fight Mode,可先看:Bot Fight Mode 会拦截 AI 爬虫吗?。