小红花·文摘

原力灵机的GeoVLA框架解决了VLA模型在非结构化环境中的空间失明问题，通过双流架构结合点云数据，提升了机器人的三维感知能力。实验表明，GeoVLA在复杂任务中的成功率显著高于传统2D模型，尤其在视角和物体尺寸变化时表现出强大的鲁棒性。

量子位 ·

全球TMT-美通国际 ·

本文介绍了多种新视角合成方法，如GVS、ViewNeTI和Light Field Diffusion，利用条件扩散模型和三维感知技术，提高了图像生成的质量和效率。研究表明在不同数据集上表现优越，并提出了新颖的相机参数化方案，以解决深度尺度的二义性问题。

BriefGPT - AI 论文速递 ·

本文探讨了扩散模型在图像处理中的应用，包括前景与背景和谐化、图像转换、视频生成和图像修复等。提出了PHDiffusion和FreePIH等新方法，以提高图像生成的质量和效率，尤其在三维感知和立体图像生成方面表现出良好的性能和应用潜力。

BriefGPT - AI 论文速递 ·

该论文提出了一种自监督预训练框架，通过神经辐射场实现多模态感知表示学习，提升三维感知任务的可迁移性。研究展示了多种方法的优越性，特别是在少样本学习和三维对象检测方面。

BriefGPT - AI 论文速递 ·

该研究探索了少样本学习在三维感知中的应用，并提出了一种新的CIA模块，将其插入到基线模型中可以显著提高性能。该模型在两个基准数据集上展示了卓越的表现。

BriefGPT - AI 论文速递 ·