搜索引擎与爬虫
Google AMP HTML是什么
网络在不断发展,对于许多企业主来说,这意味着需要随时掌握 Google 的所有变化。如果您不适应,则意味着您可能会落后。Google AMP 是他们加快网络速度的移动计划。
AMP(Accelerated Mobile Pages,加速移动页面)是一种为静态内容构建 web 页面,提供可靠和快速的渲染,加快页面加载的时间,特别是在移动 Web 端查看内容的时间。
AMP HTML 完全是基于现有 web 技术构建的,通过限制一些 HTML,CSS 和 JavaScript 部分来提供可靠的性能。这些限制是通过 AMP HTML 一个验证器强制执行的。为了弥补这些限制,AMP HTML 定义了一系列超出基础 HTML 的自定义元素来丰富内容。
从技术方面来说,采用 AMP 技术的网页之所以可以打开的这么快,这主要得益于它剔除了网页代码中各种可能会拖慢速度的部分,比如第三方的脚本文件、一些 HTML 标签、广告追踪器等等。
下面是一个 Google AMP HTML 的演示效果:
我们可以通过 Google AMP crawler - IP 查询 - 爬虫识别 查看所有的 Google-AMPHTML 的 IP 地址,同时也可以查看到 Google-AMPHTML 的最新 User-agent 等信息,这样就可以避免爬虫伪造 Google-AMPHTML 的 User-agent 来抓取您的网站。