基于英文词典语义匹配的粗粒度义库存
原文中文,约200字,阅读约需1分钟。发表于: 。本研究解决了WordNet的细粒度义词限制了其可用性的问题。通过将剑桥词典与WordNet的词义定义进行语义匹配,提出了新的粗粒度义库存。研究结果表明,这些库存在语义连贯性上优于传统粗粒度义库存,并具有较低的大规模资源依赖性、良好的相关词汇聚合能力和易于扩展和改进等优点。
本文提出了一种无监督的方法来区分名词的意义变化,并通过数字化书籍中的严格时间变化文本数据构建分布式词库网络,将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类。该方法可应用于词汇编纂和语义搜索,并经过人工评估和WordNet对比,该算法在48个样本和21个样本分别中正确识别出60.4%的新出现情况,57%的分裂/合并情况,并有44%的新意义得到WordNet验证。