如何通过 robots 协议屏蔽 Googlebot

robots.txt 是一种遵循漫游器排除标准的纯文本文件，由一条或多条规则组成。每条规则可禁止或允许特定抓取工具抓取相应网站的指定文件路径下的文件。除非您在 robots.txt 文件中另行指定，否则所有文件均隐式允许抓取。

下面是一个包含两条规则的简单 robots.txt 文件：

 User-agent: Googlebot
 Disallow: /nogooglebot/

 User-agent: *
 Allow: /

 Sitemap: http://www.example.com/sitemap.xml

以下是该 robots.txt 文件的含义：

这篇文章是否对您有帮助？

说说您的看法。

感谢您的反馈！

您的反馈次数超限，请过一段时间再提供反馈！

如何改善这篇文章，使其对你更有帮助？

很有帮助

没有帮助