SEO每天一贴 ·

怎样禁止AI抓取网站内容用于其训练

💡 原文中文，约2200字，阅读约需6分钟。

📝

内容提要

谷歌的AI抓取新规引发讨论，网站可通过robots文件禁止AI蜘蛛抓取。与搜索引擎不同，AI抓取未必带来流量回报。大网站已开始禁止GPTBot，AI的未来影响尚不确定。

🎯

🔎

AI抓取与传统搜索引擎抓取的主要区别在于流量回报。搜索引擎抓取后，网站通常能获得流量，而AI抓取则未必能带来相应的流量回报。这使得网站主在决定是否禁止AI抓取时，需要仔细考虑潜在的利益与风险。

已有242个大网站选择禁止GPTBot，这一趋势显示出行业对AI抓取的警惕性。大网站的决策可能会影响小型网站的态度，未来可能会形成更广泛的禁止潮流，尤其是在数据安全和版权问题日益受到重视的背景下。

与大网站相比，小博客对AI抓取的态度较为宽松，认为禁与不禁对自身影响不大。这反映出不同规模网站在面对AI抓取时的策略差异，小博客可能更关注内容的传播而非流量回报。

❓

网站可以在robots文件中添加特定的指令，例如使用User-agent: GPTBot和Disallow: /来禁止GPTBot抓取。

AI抓取未必带来流量回报，而搜索引擎抓取通常会为网站带来流量。

截至目前，已有242个大网站禁止GPTBot，包括亚马逊、Pinterest、Quora等。

因为AI抓取后，网站主无法确定是否会得到流量回报，且AI通常不提供内容出处。

OpenAI的抓取蜘蛛名称是GPTBot，谷歌的抓取蜘蛛名称是Google-Extended。

小博客对AI抓取的态度较为宽松，认为禁与不禁对自身影响不大。

🏷️