从学术出版物中提取知识的业务
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文讨论了学术知识图谱的构建和维护问题,认为大多数科学进步依赖于未在网上发表的隐性知识。机构、姓名和作者存在偏见,天真的系统不会考虑方法错误或衍生作品。科学真正发挥作用的内容几乎没有以文本形式发布在网络上。
🎯
关键要点
- 学术知识图谱的构建和维护因领域特殊性和缺乏标准化而困难。
- 大多数科学进步依赖于未在网上发表的隐性知识。
- 专家们多年来一直在绘制内部知识地图,论文往往优先考虑职业生涯而非信息共享。
- 存在对机构、姓名和作者的偏见,天真的系统未考虑方法错误或衍生作品。
- 专业人士依赖社交网络而非仅仅依赖文献,工具对学生有帮助。
- 知识库具有特异性,文献综述等任务难以定义和评估。
- 从学术出版物中提取和构建知识库的价值被认为可以忽略不计。
- 科学真正发挥作用的内容几乎没有以文本形式发布在网络上。
➡️