小红花·文摘

本研究提出了BreezyVoice，一个针对台湾普通话多音字消歧的文本转语音系统，结合先进语言模型，优化语音生成，尤其在代码切换环境中表现突出。

微风语音：为台湾普通话适配的TTS系统及增强的多音字消歧 -- 挑战与见解

BriefGPT - AI 论文速递 ·

本研究针对上下文感知机器翻译模型在代词消歧方面的不足，通过调整注意力头的权重，发现优化被低估的注意力头能显著提升消歧效果和模型性能。

分析上下文感知机器翻译模型中注意力头对代词消歧的影响

BriefGPT - AI 论文速递 ·

该研究提出了一种基于标记的消歧方法，旨在提升大型语言模型在开放领域问答中处理自然语言模糊性的能力，从而显著提高模型的准确性。

大型语言模型是否理解文本中的模糊性？开放领域问答的案例研究

BriefGPT - AI 论文速递 ·

本研究评估了多种大型语言模型在瑞典语词义消歧中的表现，结果显示在有训练集的情况下，模型的准确度低于最佳监督系统，但高于无监督系统。此外，人类撰写的词义定义显著提高了模型的准确性。

大型语言模型在瑞典语词义消歧中的表现如何？

BriefGPT - AI 论文速递 ·

本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题，发现大型语言模型（如BERT）在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架，强调需解决模型偏见，以确保医疗结果的公平性和准确性。同时，开发了BiasMedQA基准测试，评估模型在医学任务中的偏见影响，并呼吁对训练数据进行透明检查及提出偏见缓解策略。

朝着更公平的健康推荐：通过词义消歧找到信息丰富且无偏的样本

BriefGPT - AI 论文速递 ·

本文介绍了一项新任务：动词的视觉意义消歧，提出了一种基于Lesk算法的无监督方法，并分析了文本和多模态嵌入的性能。研究探讨了多模态模型和排序学习在词义消歧中的应用，展示了在SemEval 2023中的成果，并提出了未来研究方向。

ARPA：一种新颖的混合模型，推动视觉词义消歧的进展，结合大型语言模型和变换器

BriefGPT - AI 论文速递 ·

本研究开发了一种自监督学习算法，应用于词义识别和消歧任务，展示了其在自然语言处理中的潜力。研究探讨了预训练语言模型的特征捕捉能力，提出了姓名消歧的新方法，并分析了语义碰撞对文本理解的影响。所提出的聚类算法和模型在多个数据集上表现出色，推动了相关领域的发展。

Blowfish：用于量化语义搜索中的歧义的拓扑和统计特征

BriefGPT - AI 论文速递 ·

借助本地和全局信息交换推动全球聚类，将具有相同姓名的作者独立为不同的真实专家群体，提出了一种名为 BOND 的从零开始姓名消歧方法，通过驱动全局聚类来生成伪聚类标签，并进一步细化本地成对特征，实验证明 BOND 优于其他相对先进的基线算法，而增强版 BOND + 在 WhoIsWho 竞赛中表现不逊于其他顶级方法。

BOND: 从头开始的名称消歧与多任务推广

BriefGPT - AI 论文速递 ·