小红花·文摘

舶来词

極客死亡計劃 ·

本研究评估了多种大型语言模型在瑞典语词义消歧中的表现，结果显示在有训练集的情况下，模型的准确度低于最佳监督系统，但高于无监督系统。此外，人类撰写的词义定义显著提高了模型的准确性。

大型语言模型在瑞典语词义消歧中的表现如何？

BriefGPT - AI 论文速递 ·

本文探讨了跨语言动词语义消歧的挑战，提出了包含9504张图像的MultiSense数据集，并展示了跨语言模型在视觉背景下的优势。研究分析了BERT模型的能力与局限，提出ERNIE-M模型以增强语义建模能力，并评估了大型语言模型在跨语言任务中的表现，强调了优化方法的重要性。

谢谢你，黄纹鱼：多语言大型语言模型尚无法消歧跨语言词义

BriefGPT - AI 论文速递 ·

本文探讨了词义消歧（WSD）在自然语言处理中的应用，分析了多义性和同音异义性对计算模型的影响。研究介绍了深度学习、知识图谱等多种方法，并讨论了生物医学消歧的具体应用。论文指出词义注释语料库的稀缺性等挑战，并提出未来研究方向，如大型语言模型和多语言系统，以提升计算机对语言的理解能力。

西班牙语中的词义消歧：全面的词汇评估资源

BriefGPT - AI 论文速递 ·

本研究探讨了语言中单词独特性、声调和语音节奏的影响，强调声调在上海方言中的重要性，并通过数据驱动模型研究元音和谐及音调编码能力，揭示了词义对声调实现的影响。

基于语料库的对话台湾普通话单音节词音调轮廓的研究

BriefGPT - AI 论文速递 ·

本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题，发现大型语言模型（如BERT）在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架，强调需解决模型偏见，以确保医疗结果的公平性和准确性。同时，开发了BiasMedQA基准测试，评估模型在医学任务中的偏见影响，并呼吁对训练数据进行透明检查及提出偏见缓解策略。

朝着更公平的健康推荐：通过词义消歧找到信息丰富且无偏的样本

BriefGPT - AI 论文速递 ·

本文探讨了词嵌入模型在量化语义变化中的应用，分析了20世纪至21世纪美国对女性和少数民族态度的变化，提出了与频率和多义性相关的语义变化规律，并强调了上下文嵌入在历史语言分析中的重要性。

从购物车到卡车：英语中词义在过去两个世纪的转变

BriefGPT - AI 论文速递 ·

本文介绍了一项新任务：动词的视觉意义消歧，提出了一种基于Lesk算法的无监督方法，并分析了文本和多模态嵌入的性能。研究探讨了多模态模型和排序学习在词义消歧中的应用，展示了在SemEval 2023中的成果，并提出了未来研究方向。

ARPA：一种新颖的混合模型，推动视觉词义消歧的进展，结合大型语言模型和变换器

BriefGPT - AI 论文速递 ·

通过本文，我们引入了概念归纳这个非监督任务，从数据中学习一组定义概念的词语软聚类，该任务概括了词义归纳的任务。我们提出了一种双层方法来进行概念归纳，充分利用了本地词元为中心和全局跨词库视角来引导概念的生成。我们在 SemCor 的注释数据上评估所得到的聚类，并获得了良好的性能（BCubed F1 大于...

通过语境化语言模型诱导概念：从词义到更多

BriefGPT - AI 论文速递 ·

使用语义组合性建模的透明、可解释和语言学动机策略，模拟词的上下文意义编码，并且与复杂神经结构下的黑盒模型相比，显示其与语言学动机模型在给定语义任务中的竞争力。

情境化的词义感知：从注意力到组合性

BriefGPT - AI 论文速递 ·

该文章介绍了Alberta大学团队在SemEval-2023视觉词义消歧任务中的系统，使用了BabelNet中检索到的注释、文本和图像编码器的组合算法。此外，还使用语言模型生成的描述来增强上下文，提高准确性。官方提交结果排名第18，非官方结果更好。

香港科技大学在 SemEval-2023 任务 1 中的视觉词义消歧：通过上下文增强和视觉辅助

BriefGPT - AI 论文速递 ·

通过大型语言模型研究解决机器翻译中语义歧义的能力，并提出两种改进方法。方法通过上下文学习和在歧义数据集上微调，在五种语言方向中有四种能匹敌或胜过最先进的系统，为机器翻译中的歧义消解提供了见解。

基于显著文档上下文的神经机器翻译中改进词义消岐

BriefGPT - AI 论文速递 ·

该文介绍了一种无监督的方法来区分名词的意义变化，通过数字化书籍中的时间变化文本数据构建分布式词库网络，将它们分别聚类以获得与不同时间点对应的以词为中心的意义聚类。该方法可应用于词汇编纂和语义搜索，并经过人工评估和WordNet对比，正确识别出60.4％的新出现情况，57％的分裂/合并情况，并有44％的新意义得到WordNet验证。

能否借助词义分布检测词义的语义变化？

BriefGPT - AI 论文速递 ·

该研究设计了一种词义消歧系统，使用主题模型，能够在上下文单词数增加的情况下扩展。在5个英语全单词WSD数据集上的评估表明，该方法优于当前最先进的无监督知识为基础的WSD系统。

语言模型作为视觉词义消歧的知识库

BriefGPT - AI 论文速递 ·

该研究提出了一种基于RoBERTa的隐喻检测模型ContrastWSD，结合了隐喻识别和词义消歧，通过对比上下文意义和基本含义来确定隐喻使用。该模型利用WSD模型的词义，优于其他方法在基准数据集上的表现。

ContrastWSD: 在遵循隐喻识别程序的基础上通过词义消歧提高隐喻检测的性能

BriefGPT - AI 论文速递 ·