BriefGPT - AI 论文速递 ·

NYT-连接：一个看似简单的文本分类任务，令系统1思维者感到困惑

📝

内容提要

本研究针对大语言模型在深思熟虑推理能力方面的不足，提出了NYT-Connections，这是一系列简单的单词分类难题，旨在惩罚快速直觉思维。研究发现，即使是表现最好的LLM如GPT-4，其性能也比人类低近30%。此基准提供了一种独特的方式来评估LLM的推理能力。

➡️

继续阅读

FurnitureVLA——利用VLA学习长时域双臂家具装配：将装配长时任务拆分为多个子步骤，且提出进度VLA，以预测每个子任务的进度信号，最终实现子任务之间的切换
本文研究了利用视觉-语言-动作模型（VLA）进行真实尺度双臂家具装配。作者开发了双臂仿真流水线和VR远程操控系统，以生成高质量示教数据。通过将装配过程分解...
直播预告 | 绿盟智能渗透测试系统2.0即将首发——绿盟科技AI安全创新成果发布会
AI安全领域正在经历变革，传统防御体系面临挑战。绿盟科技计划于2026年7月15日发布智能渗透测试系统2.0，结合前沿AI模型，提升渗透测试能力，帮助企业构建安全防线。
机器狗指挥人类用天平称重！清华现场演示：无脚本，任务随机，观众即兴出题
清华大学展示了搭载一念Unisonmind大脑的机器狗“哮天”，在无预设环境中完成走迷宫、称重和估水量等复杂任务。这次演示验证了物理通用人工智能的核心特征...
LoRaWAN 发展势头强劲，1.25 亿次部署改变连接方式
LoRaWAN技术在企业连接中受到重视，已支持1.25亿次部署，年新增2500万设备。与蜂窝物联网相比，LoRaWAN更适合低功耗传感器和长续航设备。私有...
基于AgentCore harness构建高效、稳定的行程分配与优化多智能体系统
本文介绍了一种基于AgentCore harness的多智能体系统，专用于大型旅行社的集体出行任务的行程分配与优化。该系统结合大语言模型（LLM）和运筹学...
T-Rex——给VLA带上触觉的灵巧操作框架：先通过人类视频做预训练，再通过富含触觉的中期训练对齐交互，最后利用极少量目标域演示以快速适配下游任务
T-Rex是一个多模态框架，旨在提升机器人对触觉信号的反应能力。它通过构建一个包含触觉和视觉信息的统一模型，利用100小时的触觉同步遥操作数据集，支持灵巧...