小红花·文摘

如何使用Python分析分析师估计范围

freeCodeCamp.org ·

深度估计准确率冲上0.9，Meta提出VLM³，论证视觉模型天生会学3D，以Qwen3-VL-4B为基础实现多任务的统一建模

HyperAI超神经 ·

$ARM——用于长时序操作的优势奖励建模：采用三态标注策略(前进/后退/停滞），实现对相对优势的估计(含SARM详解)$

ARM——用于长时序操作的优势奖励建模：采用三态标注策略(前进/后退/停滞），实现对相对优势的估计(含SARM详解)

结构之法算法之道 ·

$ViVa——基于视频生成模型的机器人RL价值估计：比原先基于VLM的价值函数，能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计$

ViVa——基于视频生成模型的机器人RL价值估计：比原先基于VLM的价值函数，能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法算法之道 ·

GenRTC：基于联合自适应编码与带宽估计实现的生成式实时视频会议系统 | TBC 2026

实时互动网 ·

$RISE——组合式世界模型驱动的RL框架：基于视频扩散模型预测的未来视觉状态，和VLA估计的进度价值评估，以先离线预热后在线改进$

RISE——组合式世界模型驱动的RL框架：基于视频扩散模型预测的未来视觉状态，和VLA估计的进度价值评估，以先离线预热后在线改进

结构之法算法之道 ·

新方法提高统计估计的可靠性

MIT News - Artificial intelligence ·

本文研究了$n$个独立标准正态分布随机数的最大值$z_{ ext{max}}$的数学期望$ ext{E}[z_{ ext{max}}]$，结果显示随着$n$的增加，$ ext{E}[z_{ ext{max}}]$近似为$ ext{sqrt{2log n}}$，并提供了三种证明方法。同时，文章分析了低精度Attention中重复最大值的概率。

n个正态随机数的最大值的渐近估计

科学空间|Scientific Spaces ·

AV1 运动矢量保真度实现高效的光流估计，作为高质量替代方案

实时互动网 ·

$Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复：从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)$

Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复：从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)

结构之法算法之道 ·

本文讨论了随机矩阵的谱范数估计，得出结论：服从标准正态分布的$n imes m$随机矩阵的谱范数约为$ ext{sqrt}(n) + ext{sqrt}(m)$。通过近似方法和矩阵性质，提供了一种快速估计谱范数的思路，并指出该结果在大样本情况下非常准确。

随机矩阵的谱范数的快速估计

科学空间|Scientific Spaces ·

私有KL分布估计的实例最优性

Apple Machine Learning Research ·

本文探讨了机器人在智能装配中的应用，介绍了Manual2Skill论文，强调机器人如何通过视觉语言模型（VLM）从手册中学习操作技能，实现自动化家具装配。该方法解析手册内容，生成分层装配图，并预测每个步骤的组件位姿，从而提高装配效率。

Manual2Skill——让VLM从装配手册中提取装配步骤，随后做姿态估计，最终完成IKEA家具的自动组装(含IKEA-Manuals的详解)

结构之法算法之道 ·

本文讨论了在有限内存下识别数据流中频繁项的问题，介绍了三种经典的确定性流式算法：Misra-Gries、Lossy Counting和Space-Saving。这些算法通过不同的方法在内存限制下有效找出频率超过某个阈值的元素，并提供了相应的误差界和C语言实现，广泛应用于网络流量分析、搜索引擎和推荐系统等领域。

频率估计的理论极限：Space-Saving 与 Misra-Gries

土法炼钢兴趣小组的博客 ·

t-digest是一种高效的概率数据结构，专门用于在分布式环境中估计分位数，尤其是P99和P999。它通过质心压缩数据，支持亚线性空间和可合并性，适合处理大规模数据。t-digest的缩放函数确保尾部精度高，广泛应用于延迟监控等场景，并在实际应用中表现优越，常见于Elasticsearch和ClickHouse。