BriefGPT - AI 论文速递 ·

在信任之前进行测试：应用软件测试确保可信的上下文学习

📝

内容提要

该研究针对大型语言模型在上下文学习中存在的脆弱性和不可预测性问题，提出了一种名为MMT4NL的测试框架，利用软件测试技术评估其可靠性。通过生成变形对抗示例，该方法能有效识别和量化模型的缺陷，研究结果在情感分析和问答任务中揭示了多种语言缺陷，具有重要的实际应用价值。

➡️

RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
挖洞需谨慎！小米安全中心发布违规通报谴责以漏洞测试为借口进行黑客行为
#安全资讯挖洞需谨慎！小米安全中心发布违规事件处置公告，谴责以漏洞测试为借口进行黑客行为。小米在 6 月 26 日下午检测到一起影响广泛的入侵安全事件，...
MCP + A2A 融合：协议层已就绪，信任层才是硬仗 - 张善友
Linux Foundation 治理让 MCP + A2A 成为了「安全的赌注」，但安全的是协议层，不是信任层。
Samsung Galaxy Unpacked July 2026: How to watch
Samsung's next Galaxy Unpacked event is just around the corner, and the c...
[企业] 微软向IT管理员提供WSUS更新服务器故障排除指南缓解扫描失败或超时
#系统资讯 [企业] 微软向 IT 管理员提供 WSUS 更新服务器故障排除指南，通过手动清理元数据缓存可以缓解扫描失败或超时问题。这个问题从 7 月 1...
2026 07 22 HackerNews
2026-07-22 Hacker News Top Stories # Kimi Work 是一款面向知识工作者的 AI 桌面代理，支持本地文...