蓝点网 ·

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI

💡 原文中文，约1400字，阅读约需4分钟。

📝

内容提要

知乎故意使用乱码干扰搜索引擎爬虫，阻止内容被抓取用于训练AI。知乎希望保护自己的内容，可能会与某公司达成协议获取内容用于AI模型训练。

🎯

关键要点

知乎故意使用乱码干扰搜索引擎爬虫，阻止内容被抓取用于训练AI。
知乎匹配关键词spider和bot，检测到这些关键词时返回乱码信息。
知乎希望保护自己的内容，认为现有数据是巨大的金矿。
可能会与某公司达成协议获取内容用于AI模型训练。
测试显示，正常浏览器UA返回正常内容，而包含爬虫关键词的UA返回乱码。
百度爬虫也会返回乱码，但可以通过技术手段解决。
OpenAI的GPT爬虫大多数情况下返回乱码，表明知乎不希望其内容被抓取。

🏷️

继续阅读

拆解微软、谷歌、亚马逊、Meta最新财报：AI变现进入验证期 | 全球深一度
2026年第一季度，微软、谷歌、亚马逊和Meta四大科技巨头财报显示强劲增长。谷歌营收接近1100亿美元，微软AI业务年化收入达370亿美元。市场关注AI...
生产就绪AI的九项检查清单
文章讨论了将AI原型转变为可靠生产系统的过程，强调构建“AI平台切片”的重要性。平台团队需解决基础设施、安全性和可观察性等问题，以确保AI服务的可靠性和可...
魔法战胜魔法：AI提示词还得AI写
文章探讨了AI提示词的写作，认为人类编写提示词效率低下，AI更擅长此事。人类与AI的交流是跨物种沟通，AI能更好理解自身语言习惯。提示词工程师的角色正在被...
Meta正在为其AI工具投放快速致富广告
Meta收购的AI公司Manus正在推广其工具，声称可以帮助用户轻松赚取收入。该公司通过支付内容创作者在社交媒体上宣传其产品，鼓励用户利用AI为本地企业建...
世界最差程序员变得主动：构建一个破解排行榜的AI
一位自称“世界最差程序员”的新手，通过AI工具学习编程，成功创建了一个连接公司知识库的代理，帮助他在内部排行榜上获得第一名。尽管编程仍然困难，但这个项目让...
配备谷歌内置的汽车将因Gemini而变得更智能
Gemini是谷歌助手的升级版，已在配备谷歌内置的汽车中推出。用户可以通过自然对话获取信息、规划行程、管理消息和控制车辆功能。Gemini支持实时更新，帮...

知乎故意使用乱码干扰必应/谷歌等爬虫 看起来确实是阻止内容被抓取训练AI

内容提要

关键要点

标签

继续阅读

知乎故意使用乱码干扰必应/谷歌等爬虫看起来确实是阻止内容被抓取训练AI