小红花·文摘

ResULIC：语义残差编码与压缩感知扩散的超低码率图像压缩 | ICML 2025

实时互动网 ·

$Focus-Then-Contact——跟我之前给一工厂设计的插拔策略不谋而合：先ACT引导到目标区域附近，然后残差RL实施最终插入，且插入过程中视觉提供稠密奖励，必要时人工干预$

Focus-Then-Contact——跟我之前给一工厂设计的插拔策略不谋而合：先ACT引导到目标区域附近，然后残差RL实施最终插入，且插入过程中视觉提供稠密奖励，必要时人工干预

结构之法算法之道 ·

$DeepSeek-V4——迈向百万token上下文：保留V3的MoE和多token预测机制，提出混合注意力机制(CSA/HCA)、流形约束超连接mHC(替代残差)、Muon优化器(取代AdamW)$

DeepSeek-V4——迈向百万token上下文：保留V3的MoE和多token预测机制，提出混合注意力机制(CSA/HCA)、流形约束超连接mHC(替代残差)、Muon优化器(取代AdamW)

结构之法算法之道 ·

统计套利是一种基于平稳线性组合的策略，核心在于均值回归、价差中性和长短并举。文章探讨了协整检验、OU过程、PCA残差套利等方法。加密资产的统计套利面临流动性风险和资金调度的挑战，历史案例如LTCM和Quant Quake警示了相关性突变与流动性枯竭的风险。成功的关键在于识别协整窗口和快速止损。

【量化交易】统计套利：协整、配对交易、PCA 残差

土法炼钢兴趣小组的博客 ·

残差连接在Transformer中至关重要，它通过提供直通路径解决深层网络的优化问题，使每层只需学习小的修正。残差连接提高了训练的稳定性，促进了梯度的顺畅传播，避免了梯度消失问题，是Transformer成功的关键因素之一。

【Transformer 与注意力机制】24｜残差连接：为什么深层网络必须留一条直路

土法炼钢兴趣小组的博客 ·

LWiAI播客第238期 - GPT 5.4迷你版、OpenAI转型、Mamba 3、注意力残差

Last Week in AI ·

注意残差

Nathan Chen ·

$PLD——自我改进的VLA：先通过离策略RL学习一个轻量级的残差动作策略，然后让该残差策略收集专家数据，最后蒸馏到VLA中$

PLD——自我改进的VLA：先通过离策略RL学习一个轻量级的残差动作策略，然后让该残差策略收集专家数据，最后蒸馏到VLA中

结构之法算法之道 ·

LSTM之父Schmidhuber质疑何恺明是残差学习的奠基人，指出早在1991年，Hochreiter已提出循环残差连接以解决梯度消失问题。他认为ResNet等深度学习成果应归功于早期研究，争论已持续多年。

LSTM之父向何恺明开炮：我学生才是残差学习奠基人

量子位 ·

ERVQ: 基于内外码本优化的增强残差矢量量化神经音频编解码器 | TASLP2025

实时互动网 ·

本文介绍了VITAL策略学习框架，通过将操作任务分为到达和局部交互两个阶段，结合视觉和触觉感知，提高机器人在精细操作中的成功率和泛化能力。VITAL利用视觉-语言模型进行目标定位，并通过触觉反馈实现高精度操作，克服了模仿学习和强化学习的局限性。

VITAL——结合ResNet视觉与MLP触觉且带语义增强的适用于「电源插拔」的可泛化BC：先VLM定位、后执行在线残差RL微调的策略(MLP作为动作头)

结构之法算法之道 ·

机器之心数据服务已上线，提供高效稳定的数据获取，帮助用户轻松获取所需数据。

ICML 2025 | 打破残差连接瓶颈，彩云科技&北邮提出MUDDFormer架构让Transformer再进化！

机器之心 ·

本研究提出轨迹贝尔曼残差最小化（TBRM）算法，旨在优化大型语言模型（LLM）推理中的基于值的方法。TBRM有效应用贝尔曼残差最小化思想，消除对评论家和重要性采样的需求。实验结果表明，TBRM在数学推理基准上优于基于政策的方法，同时计算和内存开销相似或更低，证明基于值的强化学习能有效提升LLM推理能力。

轨迹贝尔曼残差最小化：一种简单的基于值的方法用于大型语言模型推理

BriefGPT - AI 论文速递 ·

本研究提出了一种深度乘积单元残差神经网络（PURe），有效解决了深度卷积网络在表达能力和参数效率方面的问题。PURe在多个数据集上超越了深层ResNet，展现出更快的收敛速度和更强的抗噪声能力，显示了其在计算机视觉中的应用潜力。

深度残差学习与乘积单元

BriefGPT - AI 论文速递 ·

本研究提出动态差异感知时间残差网络（DDaTR），有效解决了纵向放射报告生成中空间和时间特征提取不足的问题，显著提升了报告生成的性能和准确性，具有重要的临床应用潜力。

DDaTR：动态差异感知时间残差网络用于纵向放射报告生成

BriefGPT - AI 论文速递 ·

本研究针对声音转换中源说话者的音色信息泄露问题，提出了一种新的解决方案，即引入残差块作为内容提取器。研究证明，通过通用语义字典的内容特征重表达模块，该方法能够有效减轻音色泄露，从而显著提高目标说话者的相似度。

通过通用语义映射残差块减轻声音转换中的音色泄露

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法ReDRAW，旨在解决模拟与现实动态不一致的问题。通过对潜在状态动态进行残差校正，ReDRAW优化了强化学习代理的想象回合，有效避免了传统方法的过拟合现象。

使用潜在状态动态残差调整世界模型

BriefGPT - AI 论文速递 ·

DR-MPC：用于现实社会导航的深度残差模型预测控制

Apple Machine Learning Research ·

M2R2：多速率残差混合框架用于高效的变换器推理

Apple Machine Learning Research ·

本研究针对深度残差网络在对抗性鲁棒性和网络可认证性方面存在的挑战，提出了一种基于线性矩阵不等式（LMI）框架的新方法设计L-利普希茨深度残差网络。通过使用格尔什戈林圆定理来近似特征值位置，我们提供了一种构造利普希茨约束网络的可证明参数化方法，以提升网络设计的鲁棒性，尽管存在对非线性动态性能的抑制问题。

L-利普希茨格什戈林残差网络

BriefGPT - AI 论文速递 ·