小红花·文摘

MoE比你想象的更强大：基于RoE的超并行推理扩展

Apple Machine Learning Research ·

本研究提出了GeoUni，这是首个统一的几何专家模型，能够在单一框架内生成几何问题的解决方案和图形，填补了机器学习在该领域的空白。

GeoUni: 生成几何图形、问题及问题解决方案的统一模型

BriefGPT - AI 论文速递 ·

本研究提出AIDE框架，解决视觉语言模型（VLM）对更大模型的依赖问题。AIDE通过利用专业领域的专家模型自主增强能力，显著提升性能，无需更大模型或人工监督。

Enhancing the Capabilities of Visual Language Models through Domain Expert Engagement

BriefGPT - AI 论文速递 ·

本研究提出了“战斗编码器”，通过专家模型在竞技环境中相互挑战生成新训练数据，解决大型代码语言模型对高质量数据的依赖问题。实验结果表明，该方法在性能上具有竞争力，且不依赖专有模型。

Battle Coder: Learning from Expert Battles to Enhance Large Code Language Models

BriefGPT - AI 论文速递 ·

OpenAI于2024年12月6日推出了一种新的强化微调方法，旨在通过少量数据构建专家模型，应用于医疗和科学决策等领域。该方法结合了人类反馈的强化学习，有效学习决策过程。尽管技术潜力巨大，但数据集中在非开源公司可能带来安全隐患。

OpenAI的强化微调：RL+Science 创造新神还是灭霸？

机器之心 ·

本研究提出了一种新的国际象棋评论生成方法（CCC），结合了专家模型的决策优势与语言模型的流畅性，并开发了评估工具（GCC-Eval），以提高评论的质量和可评估性。实验结果表明，CCC生成的评论准确且信息丰富，对模型的解释性和人类教育具有重要影响。

弥合专家模型与语言模型之间的差距：概念引导的国际象棋评论生成与评估

BriefGPT - AI 论文速递 ·

本文介绍了一种高效的LLM比较评估的专家模型（PoE），通过结合不同专家的信息，可以得到一个与潜在候选集相关的表达式，具有高度灵活性。使用高斯专家时，可以导出最优候选排名的简单闭式解，以及选择哪些比较可以最大化该排名的概率的表达式。该方法能够实现高效的比较评估，只需使用一个小子集即可生成与全部比较使用时相似相关性的分数预测。在多个自然语言生成任务上评估了该方法，并证明了在执行成对比较评估时能够实现可观的计算节省。

高效 LLM 比较评估：基于专家框架的配对比较

BriefGPT - AI 论文速递 ·

我们提出了基于专家模型的冷启动与热身网络，通过整合两个专家的结果和引入动态知识蒸馏作为教师选择器，帮助专家更好地学习用户表示。在公共数据集上评估中，我们的模型在匹配阶段表现优异，胜过其他模型，并在工业级短视频平台上实现了显著的增加。

多功能异构交互建模用于冷启动评分预测

BriefGPT - AI 论文速递 ·

该研究提出了一种基于专家模型的冷启动与热身网络，通过门控网络整合两个专家的结果，并引入动态知识蒸馏作为教师选择器，以帮助专家更好地学习用户表示。该模型在公共数据集上表现优异，对于所有用户类型都胜过其他模型，并在一个工业级短视频平台上实现了显著的增加。

冷热净：解决推荐系统中的冷启动用户问题

BriefGPT - AI 论文速递 ·