维持互联网运转的文本文件
原文英文,约2900词,阅读约需11分钟。发表于: 。Illustration by Erik Carter For decades, robots.txt governed the behavior of web crawlers. But as unscrupulous AI companies seek out more and more data, the basic social contract of the web is...
三十年来,robots.txt维持互联网秩序,允许网站所有者决定搜索引擎索引网站。然而,随着人工智能发展,网站所有者对AI公司使用数据不满,媒体公司开始阻止AI爬虫访问网站。需要更强大工具管理爬虫以应对增长的AI公司。谷歌呼吁探索机器可读方式控制爬虫。