AmazonAdBot 详细信息 - IP 查询

所属公司

亚马逊公司

官方文档

AmazonAdBot

爬虫状态

活动

Amazon AdBot 是亚马逊不同广告服务部门使用的爬虫，用于确定网站的内容，以便提供相关和适当的广告。Amazon AdBot 只抓取亚马逊或广告商合作伙伴可能提供广告的网站。

User-Agent

Mozilla/5.0 (compatible; AmazonAdBot/1.0; +https://adbot.amazon.com)

爬虫类别

营销

首次出现时间

2022-10-20 16:00:00

最后一次出现时间

2023-12-07 10:39:13

是否遵守 robots.txt 协议

遵守

说明：

Amazon AdBot 是亚马逊不同广告服务用来确定网站内容以提供相关和适当广告的爬虫。

遵守 robots.txt 协议，具体写法如下：

User-agent: AmazonAdBot
Disallow: /

同时也可以设置抓取延迟：

User-agent: AmazonAdBot
Crawl-Delay: 2

Crawl-Delay 设置为 2，表示两个抓取之间有 2 秒的延迟。

IP 地址总数

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	3.216.51.216	crawler-3-216-51-216.amazonadbot.com	US
2	54.166.7.90	crawler-54-166-7-90.amazonadbot.com	US
3	52.70.140.52	crawler-52-70-140-52.amazonadbot.com	US
4	18.210.110.133	crawler-18-210-110-133.amazonadbot.com	US
5	54.163.37.67	crawler-54-163-37-67.amazonadbot.com	US

User-Agent

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Version/8.0.2 Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)

爬虫类别

营销

首次出现时间

2024-01-22 16:00:00

最后一次出现时间

2024-12-11 16:00:40

是否遵守 robots.txt 协议

遵守

说明：

Amazonbot 是亚马逊的网络爬虫，用于改善亚马逊的服务，例如使 Alexa 能够回答更多客户的问题。Amazonbot 遵循标准的 robots.txt 规则。

如何识别 Amazonbot？

在用户代理字符串中，您会看到“Amazonbot”以及其他附加代理信息。一个示例看起来像这样：

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML\, like Gecko) Version/8.0.2 Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)

您如何控制Amazonbot在您的网站上爬取什么？

Robots.txt：Amazonbot 尊重 robots.txt 中的 user-agent 和 Disallow 指令。在下面的示例中，Amazonbot 不会爬取位于 /do-not-crawl/ 或 /not-allowed 下的文档：

User-agent: Amazonbot               # Amazon's user agent
Disallow: /do-not-crawl/            # disallow this directory

User-agent: *                # any robot
Disallow: /not-allowed/      # disallow this directory

AmazonBot 不支持 robots.txt 中的 crawl-delay 指令，也不支持 HTML 页面上的 robots 元标记，如：

&lt;a href="signin.php" rel=nofollow&gt;Sign in &lt;/a&gt;
...

IP 地址总数

434

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	52.1.157.90	52-1-157-90.crawl.amazonbot.amazon	US
2	54.243.63.52	54-243-63-52.crawl.amazonbot.amazon	US
3	54.163.136.244	54-163-136-244.crawl.amazonbot.amazon	US
4	54.88.84.219	54-88-84-219.crawl.amazonbot.amazon	US
5	44.220.2.97	44-220-2-97.crawl.amazonbot.amazon	US
6	35.171.117.160	35-171-117-160.crawl.amazonbot.amazon	US
7	34.224.132.215	34-224-132-215.crawl.amazonbot.amazon	US
8	54.89.90.224	54-89-90-224.crawl.amazonbot.amazon	US
9	54.210.155.69	54-210-155-69.crawl.amazonbot.amazon	US
10	44.206.65.8	44-206-65-8.crawl.amazonbot.amazon	US

注：最多只显示10个 IP 地址

User-Agent

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)

爬虫类别

营销

首次出现时间

2024-07-28 16:00:00

最后一次出现时间

2024-08-09 20:36:43

是否遵守 robots.txt 协议

遵守

说明：

Amazonbot 是亚马逊的网络爬虫，用于改善亚马逊的服务，例如使 Alexa 能够回答更多客户的问题。Amazonbot 遵循标准的 robots.txt 规则。

如何识别 Amazonbot？

在用户代理字符串中，您会看到“Amazonbot”以及其他附加代理信息。一个示例看起来像这样：

Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/600.2.5 (KHTML, like Gecko) Safari/600.2.5 (Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot)

您如何控制Amazonbot在您的网站上爬取什么？

Robots.txt：Amazonbot 尊重 robots.txt 中的 user-agent 和 Disallow 指令。在下面的示例中，Amazonbot 不会爬取位于 /do-not-crawl/ 或 /not-allowed 下的文档：

User-agent: Amazonbot               # Amazon's user agent
Disallow: /do-not-crawl/            # disallow this directory

User-agent: *                # any robot
Disallow: /not-allowed/      # disallow this directory

IP 地址总数

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	52.70.240.171	52-70-240-171.crawl.amazonbot.amazon	US
2	23.22.35.162	23-22-35-162.crawl.amazonbot.amazon	US
3	3.224.220.101	3-224-220-101.crawl.amazonbot.amazon	US

User-Agent

Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Amazonbot/0.1; +https://developer.amazon.com/support/amazonbot) Chrome/119.0.6045.214 Safari/537.36

爬虫类别

营销

首次出现时间

2024-12-19 16:00:00

最后一次出现时间

2024-12-24 17:59:54

是否遵守 robots.txt 协议

遵守

说明：

Amazonbot 是亚马逊的网络爬虫，用于改善亚马逊的服务，例如使 Alexa 能够回答更多客户的问题。Amazonbot 遵循标准的 robots.txt 规则。

IP 地址总数

431

爬虫 IP 地址列表

#	IP 地址	Hostname	国家代码
1	100.28.49.152	100-28-49-152.crawl.amazonbot.amazon	US
2	34.225.24.180	34-225-24-180.crawl.amazonbot.amazon	US
3	52.54.15.103	52-54-15-103.crawl.amazonbot.amazon	US
4	44.215.235.20	44-215-235-20.crawl.amazonbot.amazon	US
5	54.152.163.42	54-152-163-42.crawl.amazonbot.amazon	US
6	54.84.161.62	54-84-161-62.crawl.amazonbot.amazon	US
7	54.84.147.79	54-84-147-79.crawl.amazonbot.amazon	US
8	34.196.114.170	34-196-114-170.crawl.amazonbot.amazon	US
9	34.195.248.30	34-195-248-30.crawl.amazonbot.amazon	US
10	3.212.205.90	3-212-205-90.crawl.amazonbot.amazon	US