本研究指出传统惊讶理论在词汇相似性处理中的不足,提出通过引入信息值和多样性指数来调整惊讶,从而提升预测能力。
本研究提供了一个新的词级孟加拉手语数据集(BdSL40),包含 611 个单词的 40 个视频,以及两种不同的分类方法。研究揭示了 BdSL、西孟加拉手语和印度手语之间的词汇和语义相似性,以及对 BdSL 缺乏词级数据集的情况。数据集和源代码已发布以促进进一步研究。
本论文介绍了一种名为In-CLT的新的跨语言转移提示方法,通过构建演示例子来证明其在多语言基准测试中的可行性和性能提升。该方法平均比以前的方法提高了10到20个百分点,并探讨了词汇相似性和预训练语料库在跨语言转移方面的关系。
完成下面两步后,将自动完成登录并继续当前操作。