爬虫识别支持 IPv6 地址访问 了解详情
AwarioSmartBot和AwarioRssBot是通过发送合法的网络爬虫Awario发现和收集新的和更新的网络数据。
# | IP 地址 | Hostname | 国家代码 | 旗帜 |
---|---|---|---|---|
1 | 138.201.19.21 | srv10.awar.io | DE | |
2 | 136.243.70.68 | rtc-fetcher1.awar.io | DE | |
3 | 138.201.252.169 | datanode9.webmeup.com | DE |
# | IP 地址 | Hostname | 国家代码 | 旗帜 |
---|---|---|---|---|
1 | 195.201.58.104 | srv11.awar.io | DE | |
2 | 88.99.136.237 | rss-crawler2.awar.io | DE | |
3 | 88.99.62.159 | rss-crawler1.awar.io | DE | |
4 | 88.99.2.203 | rss-crawler3.awar.io | DE |
AwarioBot/1.0 收集互联网公开数据,为互联网营销人员提供服务。
AwarioSmartBot 和 AwarioRssBot 收集Awario 应用程序 进一步使用的 Web 数据,让互联网营销人员找到谁在网上提及他们的品牌。
如果 AwarioSmartBot/AwarioRssBot 爬虫访问过您的页面,这意味着它的内容从未被收集和分析过,也不需要刷新。因此,您不会看到 AwarioSmartBot/AwarioRssBot 爬虫对同一页面的重复请求。
AwarioSmartBot 和 AwarioRssBot 是:
然而,即使 Awario 机器人是无害的,您仍然可能希望防止机器人抓取您的网站。最简单快捷的方法是使用“robots.txt”。此文本文件包含有关机器人应如何处理您的站点数据的说明。
使用 robots.txt 文件,您可以阻止 Awario 爬虫进入您的站点或减慢它们的速度,如以下示例所示:
阻止您网站的特定部分:
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /private/
阻止整个网站被访问:
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Disallow: /
放慢抓取速度:
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
Crawl-delay: 10
# | IP 地址 | Hostname | 国家代码 | 旗帜 |
---|---|---|---|---|
1 | 65.21.113.200 | pot19.webmeup.com | FI | |
2 | 65.21.113.199 | pot20.webmeup.com | FI | |
3 | 94.130.207.87 | pot19.webmeup.com | DE | |
4 | 94.130.237.168 | pot61.webmeup.com | DE | |
5 | 94.130.219.237 | pot5.webmeup.com | DE | |
6 | 46.4.107.145 | pot35.webmeup.com | DE | |
7 | 116.202.246.181 | node01.belprime.net | DE |