OpenAI推出网络爬虫机器人GPTBot
原文中文,约1100字,阅读约需3分钟。发表于: 。OpenAI推出了一种名为GPTBot的网络爬虫机器人,用于收集信息数据以改进未来的AI模型。据了解,GPTBot将严格遵守任何付费墙的规则,不会抓取需要付费的信息,并且也不会收集能追踪到个人身份的数据。 不仅如此,OpenAI也把是否要把自己的网站数据供GPTBot抓取的选择交到给网站所有者,他们可自行修改其robots.txt文件。或者通过屏蔽其IP地址,来阻止GPTBot从其网站上抓取...
OpenAI推出了名为GPTBot的网络爬虫机器人,用于收集信息数据以改进AI模型。GPTBot遵守付费墙规则,不抓取付费信息和个人身份数据。网站所有者可通过修改robots.txt文件或屏蔽IP地址来阻止GPTBot抓取数据。OpenAI表示使用GPTBot抓取的网页将用于改进模型,过滤付费信息和个人身份信息。之前从网站抓取的内容不会从ChatGPT的训练数据中删除。互联网为语言模型提供了大部分训练数据,但使用AI公司免费使用用户帖子的行为已引起争议。