BriefGPT - AI 论文速递 ·

MIR-Bench：通过多次上下文归纳推理评估LLM的长上下文智能

📝

内容提要

本研究解决了当前大语言模型在长上下文归纳推理评估中的不足，提出了MIR-Bench这一首个多次上下文归纳推理基准。该基准要求模型通过输入输出示例从多样数据格式中归纳输出，研究了模型在面对错误示例和思路链效应下的鲁棒性，并获得了有价值的发现。

🏷️

港城大发起成立的量子智能产业联盟正式启动
（全球TMT 2026年07月22日讯）香港城市大学（港城大）计算学院主办的“未来计算·未来算力”专题论坛于7 […]
斯特兰蒂斯旗下部分车型将搭载Mobileye智能路网技术
（全球TMT 2026年07月22日讯）Mobileye宣布，其云增强高级驾驶辅助系统（ADAS）技术预计自2 […]
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
Next chapter: Restructuring GitHub’s bug bounty program
GitHub is making some significant changes to its bug bounty program, shifting...
Confidential Containers becomes a CNCF incubating project
The CNCF Technical Oversight Committee (TOC) has voted to accept Confidential...
How the Galaxy Z Fold 8 and Z Flip 8 phones compare
Samsung's latest round of folding Galaxy Z phones and updated smartwatche...