ChatGPT网络搜索功能使用微软必应搜索技术 爬虫名称为OAI-SearchBot
💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
OpenAI 的 ChatGPT 网络搜索功能依赖于必应搜索技术,使用 OAI-Search 爬虫抓取数据,但不用于 AI 训练。OpenAI 还拥有 GPTBot 和 ChatGPT-User 爬虫,网站可以屏蔽 GPTBot 以保护内容,同时允许 OAI-Search 抓取。
🎯
关键要点
- ChatGPT 网络搜索功能依赖于必应搜索技术,使用 OAI-Search 爬虫抓取数据。
- OAI-Search 爬虫抓取的数据不会用于 AI 模型训练。
- OpenAI 还拥有 GPTBot 和 ChatGPT-User 爬虫,网站可以屏蔽 GPTBot 以保护内容。
- ChatGPT Search 功能与谷歌搜索存在直接竞争关系。
- OpenAI 的数据收集措施包括使用必应搜索和自有抓取内容。
- 数据抓取后会按照特定算法排序,以便在 ChatGPT 中返回结果。
- 网站可以屏蔽 GPTBot 以保护内容,同时允许 OAI-Search 抓取。
- OAI-Search 爬虫的完整 UA 和 IP 地址信息可用于防止恶意爬虫冒充。
❓
延伸问答
ChatGPT的网络搜索功能是如何工作的?
ChatGPT的网络搜索功能依赖于必应搜索技术,使用OAI-Search爬虫抓取数据,但这些数据不会用于AI模型训练。
OAI-Search爬虫与其他爬虫有什么不同?
OAI-Search爬虫专门用于ChatGPT Search抓取网络数据,而GPTBot用于训练AI模型,OAI-Search抓取的数据不会用于训练。
网站如何保护自己的内容不被抓取?
网站可以屏蔽GPTBot爬虫以保护内容,同时允许OAI-Search爬虫抓取,从而不影响来自ChatGPT Search的流量。
OpenAI使用哪些技术进行数据收集?
OpenAI的数据收集措施包括使用微软必应搜索技术和自有的内容抓取。
OAI-Search爬虫的IP地址是什么?
OAI-Search爬虫的IP地址包括20.42.10.176/28、172.203.190.128/28和51.8.102.0/24。
ChatGPT Search与谷歌搜索有什么关系?
ChatGPT Search与谷歌搜索存在直接竞争关系,都是搜索引擎。
➡️