小红花·文摘 - 小红花技术领袖俱乐部

大模型启示：泛化是进化能力的一次重大飞跃

大模型启示：泛化是进化能力的一次重大飞跃

极道 ·

一项研究探讨了思维链（CoT）训练在大语言模型中的作用，发现其主要提升了提示词动作的质量，而非推理能力。模型在训练中更依赖提示词，导致注意力和梯度集中于提示部分。研究提出了一种干预方法，通过选择性掩盖动作令牌监督，增强模型的域外泛化能力，使其在新任务中表现更佳。

一分钟读论文：《Where Do CoT Training Gains Land in LLM based Agents?》

Micropaper ·

世界模型来了因果技术标杆！具身大脑真要长脑子了

量子位 ·

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2，且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

GR00T N1.7的简介与微调——其中的VLM是“基于Qwen3-VL”的Cosmos-Reason2，且预训练数据中包含2 万小时的 EgoScale人类视频数据(含GR00T N1.6的简介)

结构之法算法之道 ·

当200位具身从业者被拉进同一个屋子

量子位 ·

LARYBench 发布：定义具身动作表征 ImageNet，首次度量从人类视频学习的泛化表征

LARYBench 发布：定义具身动作表征 ImageNet，首次度量从人类视频学习的泛化表征

美团技术团队 ·

更好的工具：利用评估数据进行工具优化的方案

更好的工具：利用评估数据进行工具优化的方案

LangChain Blog ·

超越真实数据：从正则化的视角看合成数据

超越真实数据：从正则化的视角看合成数据

Apple Machine Learning Research ·

突破传统：ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

突破传统：ReSU 神经网络单元——从果蝇大脑中获得的 AI 新灵感

Micropaper ·

Agent World Model：1000 个合成环境，让 AI 智能体学习效率翻倍

Agent World Model：1000 个合成环境，让 AI 智能体学习效率翻倍

Micropaper ·

Agent World Model（AWM）是一种新型合成环境生成管道，创建了1000个多样化场景以解决智能体训练中的环境稀缺问题。AWM通过代码驱动和数据库支持，确保环境的一致性和高效交互。实验结果表明，AWM训练的智能体在分布外泛化能力上优于传统方法，展示了合成环境在人工智能训练中的潜力。

Agent World Model 研究：1000 个合成环境推动智能体训练革命

Micropaper ·

$X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA：VLM做多模态感知，DiT-style做动作生成$

X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA：VLM做多模态感知，DiT-style做动作生成

结构之法算法之道 ·

$RDT2——基于UMI数据实现零样本且跨本体的泛化：先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)$

RDT2——基于UMI数据实现零样本且跨本体的泛化：先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)

结构之法算法之道 ·

SpecTokenizer：压缩频谱域的轻量级流式编解码器

SpecTokenizer：压缩频谱域的轻量级流式编解码器

实时互动网 ·

$HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略：基于人工势场APF和混合场景建模的全身RL算法$

HumanoidPF——让双足人形无碰撞穿越舱门的视觉-运动策略：基于人工势场APF和混合场景建模的全身RL算法

结构之法算法之道 ·

蚂蚁灵波开源的LingBot-VLA是当前最强的具身智能模型，基于20000小时真实数据，超越多个国际顶尖模型。它通过真实世界数据训练，解决了机器人在环境变化中的适应问题，展现出强大的泛化能力和高效的任务执行能力，为通用人工智能的发展提供了新路径。

蚂蚁具身智能明牌了：做大脑，和宇树们错位竞争

量子位 ·

机器学习数据增强完全指南

机器学习数据增强完全指南

MachineLearningMastery.com ·

交互式世界建模新方案！腾讯混元发布世界模型WorldPlay，兼顾实时生成与长期几何一致性；5万条样本！Med-Banana-50K支持增删病灶双向编辑

交互式世界建模新方案！腾讯混元发布世界模型WorldPlay，兼顾实时生成与长期几何一致性；5万条样本！Med-Banana-50K支持增删病灶双向编辑

HyperAI超神经 ·

腾讯优图研究发现，AI生成图像检测器在真实场景中的表现不佳，主要由于训练数据的偏差。为此，提出了“双重数据对齐”方法，通过重构和对齐数据，显著提升了检测器的泛化能力。实验结果显示，该方法在多个基准测试中表现优异，真实场景中的准确率达到82.4%。

AIGC检测为何频频“看走眼”？腾讯优图揭秘：问题可能出在数据源头

量子位 ·

Ilya 罕见发声：Scaling 时代已结束，我们对 AGI 的定义可能全错了

Ilya 罕见发声：Scaling 时代已结束，我们对 AGI 的定义可能全错了

爱范儿 ·