重新思考词语相似性:通过分类混淆实现语义相似性
📝
内容提要
本研究针对传统基于余弦相似性的词语相似性计算方法无法捕捉语义相似性的上下文依赖性和多义性的问题,提出了一种新的相似性度量方法“词语混淆”。通过使用特征基础的分类混淆,该方法能够动态选择相似性特征并通过训练分类器来映射上下文嵌入到词语身份,从而更好地理解语言的多面性与动态性,特别是在社交科学与文化分析领域的应用潜力显著。
➡️
本研究针对传统基于余弦相似性的词语相似性计算方法无法捕捉语义相似性的上下文依赖性和多义性的问题,提出了一种新的相似性度量方法“词语混淆”。通过使用特征基础的分类混淆,该方法能够动态选择相似性特征并通过训练分类器来映射上下文嵌入到词语身份,从而更好地理解语言的多面性与动态性,特别是在社交科学与文化分析领域的应用潜力显著。