小红花·文摘 - 小红花技术领袖俱乐部

大型多语言机器翻译系统取得重要突破，使用大型语言模型和多语言嵌入评估幻觉检测方法。Llama3-70B在高语料资源语言上性能提高0.16个MCC，Claude Sonnet在低资源语言上相对其他模型提高0.03个MCC。大型语言模型在低资源语言方面优势较小。

利用大型语言模型进行低资源语言和高资源语言的机器翻译幻觉检测

BriefGPT - AI 论文速递 ·

该研究提出了一种多模态的CoT框架，将语言和视觉信息相结合，提高了答案推断的准确性，比先前最先进的LLM（GPT-3.5）高出16个百分点，甚至超过了人类表现，在ScienceQA基准测试中表现出色。

MCC-KD: 多 CoT 一致知识蒸馏

BriefGPT - AI 论文速递 ·

来自 @mcc 在 cohost 的帖子

andi ·

来自 @mcc 在 cohost 的帖子

andi ·