能否借助词义分布检测词义的语义变化?

💡 原文中文,约300字,阅读约需1分钟。
📝

内容提要

该文介绍了一种无监督的方法来区分名词的意义变化,通过数字化书籍中的时间变化文本数据构建分布式词库网络,将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类。该方法可应用于词汇编纂和语义搜索,并经过人工评估和WordNet对比,正确识别出60.4%的新出现情况,57%的分裂/合并情况,并有44%的新意义得到WordNet验证。

🎯

关键要点

  • 提出了一种无监督的方法来区分名词的意义变化。
  • 通过数字化书籍中的时间变化文本数据构建分布式词库网络。
  • 将文本数据聚类以获得与不同时间点对应的以词为中心的意义聚类。
  • 该方法可应用于词汇编纂和语义搜索。
  • 经过人工评估和WordNet对比,该算法在48个样本中正确识别出60.4%的新出现情况。
  • 在21个样本中正确识别出57%的分裂/合并情况。
  • 44%的新意义得到WordNet验证。
➡️

继续阅读