本研究提出了BreezyVoice,一个针对台湾普通话多音字消歧的文本转语音系统,结合先进语言模型,优化语音生成,尤其在代码切换环境中表现突出。
本研究针对上下文感知机器翻译模型在代词消歧方面的不足,通过调整注意力头的权重,发现优化被低估的注意力头能显著提升消歧效果和模型性能。
该研究提出了一种基于标记的消歧方法,旨在提升大型语言模型在开放领域问答中处理自然语言模糊性的能力,从而显著提高模型的准确性。
本研究评估了多种大型语言模型在瑞典语词义消歧中的表现,结果显示在有训练集的情况下,模型的准确度低于最佳监督系统,但高于无监督系统。此外,人类撰写的词义定义显著提高了模型的准确性。
本论文探讨了嵌入方法在医疗领域对社会边缘群体的偏见问题,发现大型语言模型(如BERT)在性别、语言和种族方面存在显著性能差异。研究提出了公平人工智能框架,强调需解决模型偏见,以确保医疗结果的公平性和准确性。同时,开发了BiasMedQA基准测试,评估模型在医学任务中的偏见影响,并呼吁对训练数据进行透明检查及提出偏见缓解策略。
本文介绍了一项新任务:动词的视觉意义消歧,提出了一种基于Lesk算法的无监督方法,并分析了文本和多模态嵌入的性能。研究探讨了多模态模型和排序学习在词义消歧中的应用,展示了在SemEval 2023中的成果,并提出了未来研究方向。
本研究开发了一种自监督学习算法,应用于词义识别和消歧任务,展示了其在自然语言处理中的潜力。研究探讨了预训练语言模型的特征捕捉能力,提出了姓名消歧的新方法,并分析了语义碰撞对文本理解的影响。所提出的聚类算法和模型在多个数据集上表现出色,推动了相关领域的发展。
借助本地和全局信息交换推动全球聚类,将具有相同姓名的作者独立为不同的真实专家群体,提出了一种名为 BOND 的从零开始姓名消歧方法,通过驱动全局聚类来生成伪聚类标签,并进一步细化本地成对特征,实验证明 BOND 优于其他相对先进的基线算法,而增强版 BOND + 在 WhoIsWho 竞赛中表现不逊于其他顶级方法。
完成下面两步后,将自动完成登录并继续当前操作。