💡
原文中文,约2400字,阅读约需6分钟。
📝
内容提要
NeurIPS 2025公布了5290篇论文录用结果,其中火山引擎与北大合作的Q-Insight被评为亮点文章。Q-Insight通过强化学习优化图像质量,超越传统方法,展现出卓越的准确性和泛化能力,推动音视频技术发展。
🎯
关键要点
- NeurIPS 2025公布了5290篇论文录用结果,火山引擎与北大合作的Q-Insight被评为亮点文章。
- Q-Insight通过强化学习优化图像质量,超越传统方法,展现出卓越的准确性和泛化能力。
- Q-Insight是首个推理式画质理解大模型,提供了一种全新的音视频技术解决方案。
- 传统画质理解方法分为评分型和描述型,存在解释性不足和对标注数据依赖大的问题。
- Q-Insight采用群组相对策略优化(GRPO)算法,挖掘大模型自身的推理潜力,提升图像质量理解。
- Q-Insight在多个任务上达到业界领先水平,具备出色的准确性和泛化推理能力。
- 实验结果显示Q-Insight在图像质量评分、退化检测和零样本推理任务中表现卓越。
- VQ-Insight是Q-Insight的扩展,支持自然视频和AIGC视频的评估与偏好比较。
- 未来将进一步结合强化学习与多模态推理,拓展Q-Insight和VQ-Insight的应用范围。
- 多媒体实验室致力于探索多媒体领域的前沿技术,参与国际标准化工作,已获得多项国际奖项。
➡️