能否借助词义分布检测词义的语义变化?
原文中文,约300字,阅读约需1分钟。发表于: 。通过比较两个不同时期收集的语料库中目标词义的分布,利用预训练的静态感知嵌入自动标注每个语料库中目标词出现的感知 id,并使用不同的差异或距离度量来量化目标词在两个给定语料库中的语义变化,实验结果在 SemEval 2020 任务 1 数据集上显示出,可以准确地利用词义分布来预测英语、德语、瑞典语和拉丁语中词的语义变化。
该文介绍了一种无监督的方法来区分名词的意义变化,通过数字化书籍中的时间变化文本数据构建分布式词库网络,将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类。该方法可应用于词汇编纂和语义搜索,并经过人工评估和WordNet对比,正确识别出60.4%的新出现情况,57%的分裂/合并情况,并有44%的新意义得到WordNet验证。