BriefGPT - AI 论文速递 ·

SoLoPO：通过短到长的偏好优化解锁大语言模型的长上下文能力

📝

内容提要

本文针对大语言模型在实际长上下文信息利用中面临的挑战，提出了一种名为SoLoPO的框架。该框架将长上下文偏好优化分为短上下文偏好和短到长的奖励对齐两个组件，有效提升了模型在长上下文场景下的能力。实验结果表明，SoLoPO在各类长上下文基准测试中显著改善了模型的长度和领域泛化能力，并在计算和内存效率上取得了明显提升。

🏷️

继续阅读

华为云高校公开课走进中山大学，聚焦智能体时代企业级开发能力建设
7月13日，华为云开发者发展与运营部部长林华鼎受邀走进中山大学深圳校区电子与通信工程学院，为30名学生带来《AI编程实战：重构学习生活，洞见企业级开发》专...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
WAIC重磅成果｜仪电智算云在国家人工智能应用中试基地建设中展现全栈服务能力
GKE Security Blueprint Joins Growing List of Cloud AI Frameworks
Google Cloud has published a new blueprint setting out how organisations shou...
前员工实名举报导致上市受阻？小红书终于回应了
【TechWeb】7月22日消息，据财新网报道，针对近期流传的IPO消息，小红书回应称，相关信息均不属实，目前没有收到任何上市的确定信息。今年6月中旬，有...
AI驱动的CLO zFab面料测量套件开放全球供应
（全球TMT 2026年07月22日讯）CLO虚拟时尚宣布，AI驱动的面料数字化解决方案CLO zFab面料测 […]

内容提要

标签

继续阅读