爬虫识别支持 IPv6 地址访问 了解详情
莱比锡语料库 ( LCC) 是莱比锡大学自然语言处理小组的一个项目。 LCC 提供 200 多种语言的单语词典。
LCC 遵守 robots.txt 协议,如果需要通过 robots.txt 屏蔽 LCC,写法如下:
User-agent: LCC
Disallow: /
# | IP 地址 | Hostname | 国家代码 | 旗帜 |
---|---|---|---|---|
1 | 139.18.2.68 | aspra10.informatik.uni-leipzig.de | DE | |
2 | 139.18.2.214 | aspra25.informatik.uni-leipzig.de | DE |