爬虫识别

爬虫识别支持 IPv6 地址访问 了解详情

GPTBot

GPTBotGPTBot 概况

OpenAI OpCo, LLC

GPTBot

GPTBot status 活动

GPTBot 说明

使用 GPTBot 用户代理抓取的网页可能会用于改进未来的模型,并会进行过滤以删除需要付费墙访问、已知主要汇总个人身份信息 (PII) 或包含违反我们政策的文本的来源。允许 GPTBot 访问您的网站可以帮助 AI 模型变得更加准确,并提高其一般能力和安全性。

GPTBot/1.0
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
遵守
说明:

要禁止 GPTBot 访问您的网站,您可以将 GPTBot 添加到您网站的 robots.txt 中:

User-agent: GPTBot
Disallow: /

自定义 GPTBot 访问

为了允许 GPTBot 仅访问您网站的部分内容,您可以将 GPTBot 令牌添加到您网站的 robots.txt 中,如下所示:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
IP 地址总数
509
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 52.230.152.73 US US flag
2 52.230.152.11 US US flag
3 52.230.152.214 US US flag
4 52.233.106.254 US US flag
5 52.233.106.253 US US flag
6 52.233.106.252 US US flag
7 52.233.106.251 US US flag
8 52.233.106.250 US US flag
9 52.233.106.249 US US flag
10 52.233.106.248 US US flag
注:最多只显示10个 IP 地址
GPTBot/1.2
爬虫类别
首次出现时间
最后一次出现时间
是否遵守 robots.txt 协议
遵守
说明:

要禁止 GPTBot 访问您的网站,您可以将 GPTBot 添加到您网站的 robots.txt 中:

User-agent: GPTBot
Disallow: /

自定义 GPTBot 访问

为了允许 GPTBot 仅访问您网站的部分内容,您可以将 GPTBot 令牌添加到您网站的 robots.txt 中,如下所示:

User-agent: GPTBot
Allow: /directory-1/
Disallow: /directory-2/
IP 地址总数
520
爬虫 IP 地址列表
# IP 地址 Hostname 国家代码 旗帜
1 4.227.36.104 US US flag
2 4.227.36.84 US US flag
3 4.227.36.59 US US flag
4 4.227.36.22 US US flag
5 4.227.36.6 US US flag
6 4.227.36.12 US US flag
7 4.227.36.53 US US flag
8 4.227.36.43 US US flag
9 20.171.206.109 US US flag
10 20.171.206.229 US US flag
注:最多只显示10个 IP 地址
返回顶部