维基媒体希望让您和人工智能开发者更容易地搜索其数据

维基媒体希望让您和人工智能开发者更容易地搜索其数据

💡 原文英文,约700词,阅读约需3分钟。
📝

内容提要

Wikidata将推出新的AI友好数据库,旨在帮助小型科技公司提升AI系统对小众主题的理解。通过添加向量,AI将更好地理解信息的上下文。

🎯

关键要点

  • Wikidata将推出新的AI友好数据库,旨在帮助小型科技公司提升AI系统对小众主题的理解。
  • 新的数据库来自维基百科嵌入项目,旨在将维基数据的1900万条条目转化为向量格式。
  • 向量化格式使信息更易于被大型语言模型理解,提供更好的上下文和意义。
  • 项目的目标是为小型AI开发者提供与大科技公司相同的机会,帮助他们更好地利用维基数据。
  • Govdirectory是一个利用维基数据的示例项目,帮助用户找到全球公共官员的社交媒体和电子邮件。
  • 新的数据库将使AI系统更好地反映互联网上不广泛代表的小众主题。
  • 团队使用Jina AI的模型将维基数据的结构化数据转化为向量,DataStax提供存储基础设施。
  • 团队正在等待开发者的反馈,以便在未来更新数据库,尽管当前数据库不包括过去一年新增的信息。

延伸问答

维基数据的新数据库有什么特点?

新的数据库采用向量化格式,使信息更易于被大型语言模型理解,提供更好的上下文和意义。

这个项目如何帮助小型科技公司?

该项目旨在为小型AI开发者提供与大科技公司相同的机会,帮助他们更好地利用维基数据。

Govdirectory是如何利用维基数据的?

Govdirectory利用维基数据帮助用户找到全球公共官员的社交媒体和电子邮件。

新的数据库对AI系统有什么影响?

新的数据库将使AI系统更好地反映互联网上不广泛代表的小众主题。

维基数据的向量化是如何实现的?

团队使用Jina AI的模型将维基数据的结构化数据转化为向量,DataStax提供存储基础设施。

开发者如何反馈新的数据库?

团队正在等待开发者的反馈,以便在未来更新数据库。

➡️

继续阅读