从学术出版物中提取知识的业务

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文讨论了学术知识图谱的构建和维护问题,认为大多数科学进步依赖于未在网上发表的隐性知识。机构、姓名和作者存在偏见,天真的系统不会考虑方法错误或衍生作品。科学真正发挥作用的内容几乎没有以文本形式发布在网络上。

🎯

关键要点

  • 学术知识图谱的构建和维护因领域特殊性和缺乏标准化而困难。
  • 大多数科学进步依赖于未在网上发表的隐性知识。
  • 专家们多年来一直在绘制内部知识地图,论文往往优先考虑职业生涯而非信息共享。
  • 存在对机构、姓名和作者的偏见,天真的系统未考虑方法错误或衍生作品。
  • 专业人士依赖社交网络而非仅仅依赖文献,工具对学生有帮助。
  • 知识库具有特异性,文献综述等任务难以定义和评估。
  • 从学术出版物中提取和构建知识库的价值被认为可以忽略不计。
  • 科学真正发挥作用的内容几乎没有以文本形式发布在网络上。
➡️

继续阅读