为了缩小通用程序的灵活性与神经形态硬件效率之间的差距,本文提出了一种定制的用于神经形态硬件的数据流模型,名为神经形态数据流,通过引入 “when” 和 “where” 原语进行控制流的重构,结构紧凑且符合神经形态硬件的要求,在实现可编程性和塑性的同时充分利用硬件的潜力。
本文介绍了一种优先级中心的M2DM模型,利用基于Transformer的VQ-VAE得出简洁的动作表示。该模型在保真度和多样性方面超过现有技术,尤其适用于复杂的文本描述。
我们提出了可驾驶的三维高斯化身模型(D3GA),使用高斯分布点渲染人体三维模型。通过使用容积形变方法和关节角度和关键点驱动形变,我们在九个实验对象上获得了比现有方法更高质量的结果。
本文介绍了深度学习加速器性能分析框架SimDIT,可对卷积和非卷积操作进行详细统计,通过优化资源分配实现了18倍性能提升。
基于基元的体积表示可以用于建模散射和发光介质,并具有相对高效的渲染。我们提出了基于混合核心体积基元的散射和发光介质建模方法,并提供了一些优化以实现高性能和易用性。
本研究介绍了一种名为MGSSL的基于图形的分子数据自我监督学习方法,通过自生成基元的预训练框架,捕获分子图中的丰富信息,并在不同基准任务上实验,结果显示该方法优于最先进的基线。
本文介绍了GS-SLAM算法,使用3D高斯表示方法实现了定位与地图构建系统的平衡。通过自适应扩张策略和位姿跟踪技术,提高了地图优化和RGB-D重渲染的效率。在Replica和TUM-RGBD数据集上性能竞争力强。
这篇文章介绍了一种从历史手稿中自动提取几何内容的方法,以研究天文知识的传播。研究人员使用303个天文图表的数据集,并开发了一个预测几何基元的模型。他们的方法在训练和预测方面都取得了良好的结果。
本研究提出了一种近实时的方法,可以从单目RGBD视频序列中对未知物体进行6自由度跟踪,并同时进行神经3D重建。该方法适用于任意刚体对象,即使视觉纹理基本不存在。通过在HO3D,YCBInEOAT和BEHAVE数据集上的测试,证明本研究方法显著优于现有方法。
机器人辅助手术中的政策学习存在数据效率低和多功能性方法不足的问题,本研究引入了运动原始扩散(MPD),一种新的机器人辅助手术中的模仿学习方法,专注于可变形物体的轻柔操控,通过将扩散型模仿学习(DIL)的多功能性与概率动态运动原始(ProDMPs)的高质量运动生成能力相结合,实现了 MPD...
该文介绍了一种数学严谨的方法,用于近似高维数据的类流形的微分几何,并实现了流形上的对抗训练的投影梯度下降算法,以解决神经网络对对抗性攻击的敏感性问题。该方法应用于神经网络图像分类器的设置中,在流形上生成新颖的数据样本。
研究构建了机器人行为模型,能够从自然语言输入中生成行为。通过验证构架实时合成了基于给定动作基元的有向图来生成行为,展示了可验证行为生成的能力。
该论文提出了一种新的框架,用于学习3D点云的简洁几何基元表示。他们使用二次曲面来表示多种基元,并提出了一个端到端学习的框架QuadricsNet来解析点云中的二次曲面。他们还收集了一个新颖的模式综合的数据集,用于训练和评估。实验证明了他们的方法的有效性和鲁棒性。他们的代码可在GitHub上获得。
该研究提出了一种新的人机辅助灵巧抓取任务,通过Grasping Gradient Field和历史剩余策略解决了用户意图多样性和物体几何形状的挑战,并证明了该方法在实际应用中的优越性。
研究人员提出了一种使用Composition Transformer(CoT)框架解决组合式零样本学习(CZSL)中上下文问题、视觉特征可辨识性问题和真实世界组合数据长尾分布问题的简单可扩展方法。CoT框架通过自下而上提取物体嵌入,并通过自上而下建模上下文性的对象引导注意力模块生成属性嵌入。研究人员还开发了少数类属性增广(MAA)方法,通过混合图像和过采样少数类属性合成虚拟样本,解决数据分布不平衡引起的预测偏差。该方法在多个基准测试集上达到最先进性能,展示了CoT在提高视觉辨识能力和解决数据分布不平衡引起的模型偏差方面的有效性。
本文介绍了.NET类型系统中的基元类型、非托管类型和可复制类型。基元类型包括整数、浮点数、布尔和字符类型。非托管类型是不涉及托管对象引用的值类型,包括基元类型、枚举类型、指针类型和只包含非托管类型字段的结构体。可复制类型是在P/Invoke互操作中对传递的值是否需要转换进行分类的类型,包括除布尔和字符类型外的基元类型、基元类型的一维数组和采用Sequential和Explicitly布局的结构体或类。
完成下面两步后,将自动完成登录并继续当前操作。