小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
ARM——用于长时序操作的优势奖励建模:采用三态标注策略(前进/后退/停滞),实现对相对优势的估计(含SARM详解)

研究者提出了优势奖励建模(ARM)框架,以解决长时间跨度机器人任务中的稀疏奖励问题。ARM通过三态标注策略(前进、后退、停滞)降低人类标注负担,并自动生成进度标注。在毛巾折叠任务中,该方法实现了99.4%的成功率,显著提高了强化学习的效率和稳定性。

ARM——用于长时序操作的优势奖励建模:采用三态标注策略(前进/后退/停滞),实现对相对优势的估计(含SARM详解)

结构之法 算法之道
结构之法 算法之道 · 2026-04-28T16:09:26Z
ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

本文探讨了觉-语言-动作(VLA)模型在机器人学习中的应用,提出了一种视频生成式价值模型(ViVa),通过预测未来状态来改进价值估计。ViVa结合预训练的视频生成模型、当前观测和本体感知,评估任务进展,提升机器人在复杂环境中的操作能力。研究表明,该方法在真实世界任务中表现优越,能够有效跟踪任务进度并处理新颖物体。

ViVa——基于视频生成模型的机器人RL价值估计:比原先基于VLM的价值函数,能更好的在动态交互环境中对当前进度和未来走势下所带来的回报做估计

结构之法 算法之道
结构之法 算法之道 · 2026-04-16T05:50:55Z
GenRTC:基于联合自适应编码与带宽估计实现的生成式实时视频会议系统 | TBC 2026

GenRTC是一种新型的视频会议系统,专为低带宽环境设计。通过生成式人脸编码和自适应带宽估计,GenRTC在200Kbps以下的网络中显著提升视频质量和稳定性,超时率降至5.4%。该系统动态选择编码方案,确保低延迟和高保真度,适应网络波动,实验结果显示其在极端低带宽下表现优异,突破了传统RTC系统的限制。

GenRTC:基于联合自适应编码与带宽估计实现的生成式实时视频会议系统 | TBC 2026

实时互动网
实时互动网 · 2026-03-13T06:34:40Z
RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进

RISE是一个通过想象进行机器人强化学习的框架,旨在提升视觉-语言-动作模型在复杂任务中的鲁棒性。它结合动力学预测和价值估计,利用组合式世界模型生成高效学习信号,表现优于传统强化学习方法,能够有效应对动态适应性和精确性要求的任务。

RISE——组合式世界模型驱动的RL框架:基于视频扩散模型预测的未来视觉状态,和VLA估计的进度价值评估,以先离线预热后在线改进

结构之法 算法之道
结构之法 算法之道 · 2026-02-18T15:07:31Z
新方法提高统计估计的可靠性

麻省理工学院的研究人员发现,传统空间数据分析方法生成的置信区间常常不准确。他们提出了一种新方法,考虑数据的空间平滑变化,从而更可靠地生成置信区间。这项研究有助于环境科学、经济学和流行病学等领域更好地理解实验结果的可信度。

新方法提高统计估计的可靠性

MIT News - Artificial intelligence
MIT News - Artificial intelligence · 2025-12-12T05:00:00Z

本文研究了$n$个独立标准正态分布随机数的最大值$z_{ ext{max}}$的数学期望$ ext{E}[z_{ ext{max}}]$,结果显示随着$n$的增加,$ ext{E}[z_{ ext{max}}]$近似为$ ext{sqrt{2log n}}$,并提供了三种证明方法。同时,文章分析了低精度Attention中重复最大值的概率。

n个正态随机数的最大值的渐近估计

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-11-06T13:24:00Z
AV1 运动矢量保真度实现高效的光流估计,作为高质量替代方案

研究人员利用AV1视频编码中的运动矢量提升光流估计的效率与准确性。通过与真实数据对比,验证了其保真度,并发现将这些矢量作为深度学习算法RAFT的起点,可以将处理速度提高四倍,且精度影响最小。这为实时运动感知应用开辟了新可能。

AV1 运动矢量保真度实现高效的光流估计,作为高质量替代方案

实时互动网
实时互动网 · 2025-10-31T03:50:25Z
Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复:从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)

本文探讨了WHAM和GVHMR模型在人体姿态估计中的应用。WHAM利用视频数据和RNN进行3D运动预测,优化脚接触感知;GVHMR在重力坐标系中恢复人体运动,减少误差累积,提高精度。

Video2Motion之GVHMR——基于重力-视角坐标的人体运动恢复:从RGB视频中提取人的SMPL轨迹(含人体姿态估计WHAM的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-10-28T13:02:34Z

本文讨论了随机矩阵的谱范数估计,得出结论:服从标准正态分布的$n imes m$随机矩阵的谱范数约为$ ext{sqrt}(n) + ext{sqrt}(m)$。通过近似方法和矩阵性质,提供了一种快速估计谱范数的思路,并指出该结果在大样本情况下非常准确。

随机矩阵的谱范数的快速估计

科学空间|Scientific Spaces
科学空间|Scientific Spaces · 2025-10-12T13:52:00Z
私有KL分布估计的实例最优性

本文研究了在给定独立同分布样本的情况下,如何估计未知离散分布,重点在于最小化真实分布与算法估计之间的KL散度。我们提出了实例最优的算法,能够在有无差分隐私约束的情况下实现最优性能,并利用Good-Turing估计器的变体建立上界。

私有KL分布估计的实例最优性

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-22T00:00:00Z

本文探讨了机器人在智能装配中的应用,介绍了Manual2Skill论文,强调机器人如何通过视觉语言模型(VLM)从手册中学习操作技能,实现自动化家具装配。该方法解析手册内容,生成分层装配图,并预测每个步骤的组件位姿,从而提高装配效率。

Manual2Skill——让VLM从装配手册中提取装配步骤,随后做姿态估计,最终完成IKEA家具的自动组装(含IKEA-Manuals的详解)

结构之法 算法之道
结构之法 算法之道 · 2025-08-01T17:14:51Z

t-digest是一种高效的概率数据结构,专门用于在分布式环境中估计分位数,尤其是P99和P999。它通过质心压缩数据,支持亚线性空间和可合并性,适合处理大规模数据。t-digest的缩放函数确保尾部精度高,广泛应用于延迟监控等场景,并在实际应用中表现优越,常见于Elasticsearch和ClickHouse。

t-digest:分布式系统中的分位数估计

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z

本文讨论了在有限内存下识别数据流中频繁项的问题,介绍了三种经典的确定性流式算法:Misra-Gries、Lossy Counting和Space-Saving。这些算法通过不同的方法在内存限制下有效找出频率超过某个阈值的元素,并提供了相应的误差界和C语言实现,广泛应用于网络流量分析、搜索引擎和推荐系统等领域。

频率估计的理论极限:Space-Saving 与 Misra-Gries

土法炼钢兴趣小组的博客
土法炼钢兴趣小组的博客 · 2025-07-15T00:00:00Z

浙江工业大学推出Distill-Any-Depth项目,通过蒸馏算法整合多个模型,仅需2万张无标签图像即可实现高精度的单目深度估计,显著降低数据标注成本,广泛应用于自动驾驶等领域。

成本大幅降低!Distill-Any-Depth实现高精度深度估计;入选CVPR 2025!Real-IADD解锁工业检测新高度

HyperAI超神经
HyperAI超神经 · 2025-06-23T06:16:49Z
基础模型隐藏表示在听诊中用于心率估计

本文研究了六种自监督声学表示模型在心率估计中的表现,发现预训练模型的表示向量与基线方法相当,而自家CLAP模型在心率估计上表现更佳,误差更低。

基础模型隐藏表示在听诊中用于心率估计

Apple Machine Learning Research
Apple Machine Learning Research · 2025-05-28T00:00:00Z

本研究提出了一种广义标签偏移(GLS)方法,以解决跨域视线估计中的领域偏移问题。通过重要性重加权策略,实验结果表明该方法在不同模型上具有良好的泛化能力。

跨域视线估计的广义标签偏移视角

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究构建了包含84,446张图片和908种快餐类别的FastFood数据集,解决了营养估计中的注释不足问题,并提出了一种新的视觉-成分特征融合方法(VIF²),提高了营养估计的准确性。实验结果验证了成分信息的重要性及方法的有效性。

通过视觉-成分特征融合推动食品营养估计的进展

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种新的离线安全强化学习框架FASP,解决了现有方法短期安全性不足的问题。通过汉密尔顿-雅可比分析生成安全标签,确保高效采样和长期安全保障,实验结果表明其表现优异。

考虑可行性的悲观估计:面向离线强化学习的长远安全性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

机器之心数据服务现已上线,提供高效稳定的数据获取,简化数据爬取流程。

Copilot上大分,仅数天,陶哲轩的估计验证工具卷到2.0!刚刚又发数学形式化证明视频

机器之心
机器之心 · 2025-05-11T13:05:06Z
一个验证估计的工具,II:灵活的证明助手

我更新了一个自动验证工具,使其成为灵活的证明助手,支持符号代数和交互式证明。用户可以输入高层策略,助手会执行计算,并支持渐近估计,计划进一步增强功能。

一个验证估计的工具,II:灵活的证明助手

What's new by TerryTao
What's new by TerryTao · 2025-05-10T00:41:34Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码