该研究提出了一种新模型,通过重新分配单词权重来模拟相似语境中单词之间的语义共享,并将其纳入文档表示法中。该模型在无监督设置下,在难度逐渐增加的数据集上获得了最好的微观和宏观F1分数。研究主题是单词嵌入和语义含义。
本文研究了使用英语Wiktionary作为替代监督源来注入词汇,并测试了降维对生成的上下文词嵌入的影响。在无监督设置下取得了新的SoTA结果,并提出了两个新的WiC测试集来展示微调方法的改进。观察到语义框架归纳任务的改进。方法适用于具有大型Wiktionary的多种语言。
完成下面两步后,将自动完成登录并继续当前操作。