💡
原文英文,约300词,阅读约需1分钟。
📝
内容提要
维基百科发布了一个优化的数据集,旨在防止人工智能开发者抓取其平台。该数据集与Kaggle合作,提供英文和法文的结构化内容,包括研究摘要、短描述和图像链接,开放许可,旨在减轻AI对维基百科服务器的压力。
🎯
关键要点
- 维基百科发布了一个优化的数据集,旨在防止人工智能开发者抓取其平台。
- 该数据集与Kaggle合作,提供英文和法文的结构化内容。
- 数据集包括研究摘要、短描述、图像链接和信息框数据,开放许可。
- 数据集旨在减轻AI对维基百科服务器的压力。
- Kaggle提供的结构化JSON格式内容是抓取原始文章文本的更好替代方案。
- 维基百科与Google和互联网档案馆已有内容共享协议,Kaggle合作使数据更易于访问。
- Kaggle对承载维基百科的数据感到兴奋,致力于保持数据的可访问性和实用性。
➡️