小红花·文摘

利用音视频数据缩小自监督语音模型中的多语言差距

Apple Machine Learning Research ·

为什么动态追踪落地难？OpenResty XRay 如何破局？

OpenResty 官方博客 ·

本文研究了大型语言模型输出中的幻觉问题，提出了REFIND框架，通过文档检索检测幻觉，并引入上下文敏感性比率（CSR）指标，展示其在多语言环境下的优越检测性能，从而提升模型的可靠性。

REFIND: Retrieval-Augmented Factuality Hallucination Detection in Large Language Models

BriefGPT - AI 论文速递 ·

本研究分析了大型语言模型在多语言环境中的幻觉现象，发现高资源语言模型生成的回应更长且幻觉率较高，而小型模型的幻觉率更高。这对幻觉率的评估方法具有重要影响。

大型语言模型在多语言中产生幻觉的程度有多大？关于多语言幻觉的实地估计

BriefGPT - AI 论文速递 ·

本研究针对CoMeDi共享任务的分歧排名子任务，提出了一种新方法，利用paraphrase-xlm-r-multilingual-v1模型生成的句子嵌入和深度神经回归模型。优化后的系统在Spearman相关性表现上达到了竞争性水平，强调了在多语言环境中处理判断差异的重要性。

FuocChuVIP123在CoMeDi共享任务中的表现：利用XLM-Roberta句子嵌入和深度神经回归进行分歧排名

BriefGPT - AI 论文速递 ·

本研究提出了DRPruning方法，利用分布鲁棒优化技术应对大型语言模型在规模和计算成本上的挑战。实验结果显示，该方法在单语和多语言环境中表现优越，具有广泛的应用潜力。

DRPruning: Efficient Large Language Model Pruning through Distributionally Robust Optimization

BriefGPT - AI 论文速递 ·

本研究评估了多语言环境下的意图识别模型，提出了多种方法和数据集以提高Code Mix话语的意图检测性能。研究表明，预训练模型和对比学习策略在多意图检测中表现优越，尤其在低资源语言环境下。

基于指针网络的多标签多类别意图联合提取与检测方法

BriefGPT - AI 论文速递 ·

本文综述了大型语言模型（LLMs）的架构、训练策略及其在多语言环境中的应用，探讨了模型性能评估和未来研究方向。研究表明，针对低资源语言和欧洲官方语言的LLMs具有显著的性能提升潜力，并提出了提高多语言适应性的方法，以推动自然语言处理的平等与包容性。

从以英语为中心到有效的双语：支持低代表性语言的自定义分词器的大型语言模型

BriefGPT - AI 论文速递 ·

本研究评估了大型语言模型在真实多语言环境中用于健康聊天机器人的表现。分析了24个模型在印度患者数据上的应用，发现模型在印度语言查询中的表现差异显著，尤其在文化和语言混合的查询中面临挑战，指出了健康聊天机器人改进的潜力。

健康评估：在真实多语言环境中评估RAG模型用于健康聊天机器人

BriefGPT - AI 论文速递 ·

本研究探讨了多语言环境中检测LGBTQIA+仇恨言论的挑战，特别是机器翻译对细微差别的影响。评估结果显示，英文检测效果最佳，而英泰代码混合情况最差。微调模型在各语言中提高了一致性，表明社会文化差异可能未被自动翻译捕捉。

Is Hate Lost in Translation?: An Evaluation of Multilingual LGBTQIA+ Hate Speech Detection

BriefGPT - AI 论文速递 ·

本文综述了大语言模型（LLMs）的评估方法，探讨了其在多语言和文化环境中的应用及挑战。研究强调文化考量的重要性，并提出新的评估基准CDEval，以提升模型的文化敏感性。通过对泰语及其他语言的评估，发现现有模型在多语言环境中的表现存在显著差距，呼吁改进评估机制以促进LLMs的实际应用和发展。

代表不足的群体：为开发泰国语言模型设定文化和核心能力基准

BriefGPT - AI 论文速递 ·

本研究提出了一种创新的神经检索架构，用于解决多语言环境下自由职业者与项目匹配的挑战。该方法通过对历史数据进行对比损失训练，提升了技能匹配的效率和准确性，超越了传统方法。

Large-Scale Skill Matching: Efficient Freelancer and Project Alignment

BriefGPT - AI 论文速递 ·

本文研究了大型语言模型（LLM）的评估方法，指出现有评估存在偏差，建议使用本地语言数据集进行校准。构建了综合评估框架，提出了标准化评估人类对齐性的方法，并分析了自动评估的可靠性。研究表明，LLM在多语言环境中的表现差异显著，强调了提升模型理解复杂意义的重要性。

作为评审的LLM与奖励模型：它们能做什么，不能做什么

BriefGPT - AI 论文速递 ·

本文研究了不同提示方法在大型语言模型（LLMs）中的有效性，发现Schema提示能够提升训练效果。同时，探讨了LLMs在多语言环境下的表现，提出无监督提示方法在低资源语言上优于有监督方法。研究强调提示设计对模型性能的重要性，并提供了分类和评估标准，以促进自然语言处理任务的应用。

本土与非本土语言提示：比较分析

BriefGPT - AI 论文速递 ·

本文提出了一种跨模态的语音和语言模型，利用新型分词器提升语音翻译和自然语言处理的性能。研究表明，分词器的选择对模型效果和训练成本有显著影响，尤其在多语言环境中，优化分词器能显著提高性能和效率。

LAST: 语言模型感知的语音分词

BriefGPT - AI 论文速递 ·

本文介绍了多种知识图谱增强方法，如KGA、AutoKG和Docs2KG，利用自然语言处理和机器学习技术提升知识图谱的构建和性能。这些方法在实体链接和知识图谱补全等任务中显著提高了准确性和效率，尤其在多语言环境下表现出良好的应用潜力。

iText2KG：利用大型语言模型构建增量知识图谱

BriefGPT - AI 论文速递 ·

大型语言模型（LLMs）在多语言环境中存在安全隐患，研究表明多语言模型更易受攻击。通过自卫框架训练可以减少不安全内容，低资源语言的恶意提示导致更多无关回答。研究提出的新算法和缓解策略显著降低了攻击成功率，强调了加强安全措施的必要性。

逆境而行：克服多语言嵌入反转攻击中的类型、脚本和语言混淆

BriefGPT - AI 论文速递 ·

本文研究音视频问答（AVQA）任务，提出了MUSIC-AVQA数据集及多种新方法，如渐进式时空感知网络和上下文多模态对齐网络，显著提升了问答性能。同时，研究探讨了多语言环境下的AVQA，提出新的数据集和框架，以提高鲁棒性和准确性。

通过关键语义感知线索提升音频视觉问答

BriefGPT - AI 论文速递 ·

EAGLE框架通过自下而上的特征级联操作，实现大型语言模型的无损加速。自我推测解码方法分为草稿和验证两个阶段，确保输出质量与原始模型一致。该方法无需额外训练，最高可加速1.73倍，显著提高推理效率，适用于多语言环境，优化推理时间和生成准确性。

EAGLE-2：使用动态草稿树加速语言模型推理

BriefGPT - AI 论文速递 ·

该论文提出了一种利用大型语言模型增强扩散模型推理能力的方法，分为生成场景布局和图像生成两个阶段。研究表明，该方法在复杂场景生成中表现优越，能够提高图像生成质量，并在多语言环境下有效应用。

大型语言模型在扩散模型中的提示编码作用探索

BriefGPT - AI 论文速递 ·