舶来词是指从其他语言完全或部分吸收的词汇,通常以音译形式出现,如“沙发”、“巧克力”。其词义可能因语言而异,例如法语的“café”在英语中指“小餐馆”。
本研究评估了多种大型语言模型在瑞典语词义消歧中的表现,结果显示在有训练集的情况下,模型的准确度低于最佳监督系统,但高于无监督系统。此外,人类撰写的词义定义显著提高了模型的准确性。
本文探讨了跨语言动词语义消歧的挑战,提出了包含9504张图像的MultiSense数据集,并展示了跨语言模型在视觉背景下的优势。研究分析了BERT模型的能力与局限,提出ERNIE-M模型以增强语义建模能力,并评估了大型语言模型在跨语言任务中的表现,强调了优化方法的重要性。
本文探讨了词义消歧(WSD)在自然语言处理中的应用,分析了多义性和同音异义性对计算模型的影响。研究介绍了深度学习、知识图谱等多种方法,并讨论了生物医学消歧的具体应用。论文指出词义注释语料库的稀缺性等挑战,并提出未来研究方向,如大型语言模型和多语言系统,以提升计算机对语言的理解能力。
本研究探讨了语言中单词独特性、声调和语音节奏的影响,强调声调在上海方言中的重要性,并通过数据驱动模型研究元音和谐及音调编码能力,揭示了词义对声调实现的影响。
本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题,发现大型语言模型(如BERT)在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架,强调需解决模型偏见,以确保医疗结果的公平性和准确性。同时,开发了BiasMedQA基准测试,评估模型在医学任务中的偏见影响,并呼吁对训练数据进行透明检查及提出偏见缓解策略。
本文探讨了词嵌入模型在量化语义变化中的应用,分析了20世纪至21世纪美国对女性和少数民族态度的变化,提出了与频率和多义性相关的语义变化规律,并强调了上下文嵌入在历史语言分析中的重要性。
本文介绍了一项新任务:动词的视觉意义消歧,提出了一种基于Lesk算法的无监督方法,并分析了文本和多模态嵌入的性能。研究探讨了多模态模型和排序学习在词义消歧中的应用,展示了在SemEval 2023中的成果,并提出了未来研究方向。
通过本文,我们引入了概念归纳这个非监督任务,从数据中学习一组定义概念的词语软聚类,该任务概括了词义归纳的任务。我们提出了一种双层方法来进行概念归纳,充分利用了本地词元为中心和全局跨词库视角来引导概念的生成。我们在 SemCor 的注释数据上评估所得到的聚类,并获得了良好的性能(BCubed F1 大于...
使用语义组合性建模的透明、可解释和语言学动机策略,模拟词的上下文意义编码,并且与复杂神经结构下的黑盒模型相比,显示其与语言学动机模型在给定语义任务中的竞争力。
该文章介绍了Alberta大学团队在SemEval-2023视觉词义消歧任务中的系统,使用了BabelNet中检索到的注释、文本和图像编码器的组合算法。此外,还使用语言模型生成的描述来增强上下文,提高准确性。官方提交结果排名第18,非官方结果更好。
通过大型语言模型研究解决机器翻译中语义歧义的能力,并提出两种改进方法。方法通过上下文学习和在歧义数据集上微调,在五种语言方向中有四种能匹敌或胜过最先进的系统,为机器翻译中的歧义消解提供了见解。
该文介绍了一种无监督的方法来区分名词的意义变化,通过数字化书籍中的时间变化文本数据构建分布式词库网络,将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类。该方法可应用于词汇编纂和语义搜索,并经过人工评估和WordNet对比,正确识别出60.4%的新出现情况,57%的分裂/合并情况,并有44%的新意义得到WordNet验证。
该研究设计了一种词义消歧系统,使用主题模型,能够在上下文单词数增加的情况下扩展。在5个英语全单词WSD数据集上的评估表明,该方法优于当前最先进的无监督知识为基础的WSD系统。
该研究提出了一种基于RoBERTa的隐喻检测模型ContrastWSD,结合了隐喻识别和词义消歧,通过对比上下文意义和基本含义来确定隐喻使用。该模型利用WSD模型的词义,优于其他方法在基准数据集上的表现。
完成下面两步后,将自动完成登录并继续当前操作。