小红花·文摘

$πRL——首个在线RL微调流式VLA π0/π0.5的框架：通过Flow-Noise和Flow-SDE实现精确对数似然估计，全面提升性能$

πRL——首个在线RL微调流式VLA π0/π0.5的框架：通过Flow-Noise和Flow-SDE实现精确对数似然估计，全面提升性能

结构之法算法之道 ·

腾讯混元团队提出的MixGRPO框架结合了SDE与ODE采样，显著提升了图像生成的效率和性能，训练时间减少近50%。MixGRPO-Flash进一步将训练时间降低71%，在多个维度上优于DanceGRPO，推动了图像生成技术的发展。

训练时间减半，性能不降反升！腾讯混元开源图像生成高效强化方案MixGRPO

量子位 ·

初学者如何为软件开发工程师（SDE）职位做准备

DEV Community ·

本文介绍了一种新型图像超分辨率方法ACDMSR，利用预训练的扩散模型和可控特征模块，克服了固定尺寸的限制。该方法通过减少扩散步骤，提高了推理速度和图像质量，实验结果表明其性能优于现有方法。此外，XPSR框架结合多模态大语言模型，增强了语义信息提取，生成高保真度图像。

利用领域转移SDE驯化扩散先验进行图像超分辨率

BriefGPT - AI 论文速递 ·

成为软件开发工程师（SDE）的完整指南

DEV Community ·

通过扩展 Virtual Brownian Tree (VBT) 方法，我们成功地生成了 Brownian motion (BM) 的时间积分，使得我们可以采用高阶随机微分方程（SDE）求解器进行自适应求解，并展示了两个应用领域的实例。

自适应和高阶 SDE 求解器的布朗路径和积分的单种子生成

BriefGPT - AI 论文速递 ·

近年来，研究者对现代机器学习算法的泛化能力进行了深入研究。最近的研究发现，随机梯度下降算法的学习动态与重尾动态有关，可以应用于泛化理论。本研究证明了一类重尾动态轨迹上的泛化界限，并提出了一个几何解耦项，通过比较经验风险和预期风险的动态来引入。此外，还提出了一个基于扰动动态的PAC-Bayesian设置，用于收紧界限。

通过分数型福克 - 普朗克方程推导重尾 SDE 的泛化界限

BriefGPT - AI 论文速递 ·

该文章介绍了一种新的方法，利用深度神经网络导出和分析随机微分方程。该方法通过学习维纳混沌展开式的最佳稀疏截断来减轻指数复杂性问题，利用随机过程的多项式混沌展开。数值实验展示了该方法在一维和高维中的有希望性能。

基于深度操作器网络架构的功能 SDE 近似

BriefGPT - AI 论文速递 ·

本研究探讨了基于分数的生成模型，通过加噪声扰动学习对应于数据密度的噪声条件分数函数，并导出了分数Fokker-Planck方程。提出了正则化的DSM目标来强制满足分数Fokker-Planck方程，并在各种数据集上证明了其有效性。

通过福克 - 普朗克方程来缩小基于评分的扩散模型中的 ODE-SDE 差距

BriefGPT - AI 论文速递 ·

本文介绍了从线性随机微分方程（SDE）的生成器中提取鉴别条件的重要性，以及针对具有加性噪声和乘性噪声的线性 SDE 生成器的充分必要条件。作者还提供了导出的鉴别条件的几何解释，并进行了一系列模拟来验证理论结果。

具有加性和乘性噪声的线性 SDE 的生成器识别

BriefGPT - AI 论文速递 ·