量子位 ·

破解AI对不同上下⽂位置的敏感度不⼀致，新框架使出“解铃还须系铃人”

💡 原文中文，约3400字，阅读约需8分钟。

📝

内容提要

Pos2Distill框架旨在解决AI模型在不同上下文位置的偏见，通过将优势位置的能力迁移至劣势位置，提升复杂推理和长文本理解的一致性。该框架分为Pos2Distill-R1和Pos2Distill-R2，分别针对检索和推理任务，显著提升模型性能。

🎯

❓

Pos2Distill框架旨在解决AI模型在不同上下文位置的偏见，提升复杂推理和长文本理解的一致性。

Pos2Distill-R1主要针对检索任务，通过KL散度损失缓解词元偏移；而Pos2Distill-R2则针对推理任务，通过蒸馏优质CoT响应来纠正思维偏移。

Pos2Distill-R1在WebQ数据集上实现了56.7%的平均准确率，接近最佳汇聚位置的表现。

通过将优势位置的能力迁移至劣势位置，Pos2Distill框架有效缓解了位置偏见。

Pos2Distill-R2在MusiQue数据集上实现了42.8的精确匹配得分，超越了现有自我训练方法。

Pos2Distill框架的核心思想是利用模型自身已习得的知识来纠正其系统性偏差。

🏷️

史上最强游戏掌机来了！性能堪比 PS5，但……
今年掌机市场因元器件成本上涨而涨价，但英特尔等公司推出的新芯片提升了掌机性能和能效。微星和宏碁的新款掌机搭载英特尔 Arc G3 处理器，表现出色，续航能...
与TorchRec KeyedJaggedTensor的同步
推荐系统中的稀疏特征用于建模用户偏好和物品特性，但存在输入数据长度不一和内存浪费的问题。TorchRec的KeyedJaggedTensor通过合并稀疏特...
Seedance MCP 对接指南
Seedance MCP 是由 Anthropic 推出的模型上下文协议，允许 AI 模型通过标准化接口调用外部工具。用户可以通过 AceData Clo...
微软在Build大会发布七款MAI新模型：顶尖MAI-Thinking-1深度拆解
微软在Build大会上发布了七款新AI模型，特别是MAI-Thinking-1，展示了其完整的AI产业链。通过自研MAIA芯片和大量人类数据训练，微软实现...
这家人工智能初创公司声称能够判断一个剧本是否会成为热门电影
AI初创公司Quilty声称通过剧本分析预测电影票房成功，但实际测试结果不佳，预测不准确。Quilty结合多种AI工具提供剧本分析和成功概率评分，旨在帮助...
有人靠CPU把AI算力密度卷到了新高度
英特尔推出新技术以应对Agentic AI的算力焦虑，提升AI算力密度，推动数据中心和AI的发展。