机器之心 ·

ICLR 2025 | 原生3D+流匹配，现有SOTA被GaussianAnything超越

💡 原文中文，约4400字，阅读约需11分钟。

📝

内容提要

兰宇时是南洋理工大学的博士生，研究神经渲染的3D生成模型。他的团队提出了GaussianAnything框架，解决了3D生成中的输入格式和潜空间设计问题，实现高质量的3D生成和可控编辑。该方法在Objaverse数据集上训练，超越了现有技术，所有模型和代码已开源。

🎯

❓

GaussianAnything框架通过引入交互式的点云结构化潜空间，解决了3D生成中的输入格式和潜空间设计问题，实现了高质量的3D生成和可控编辑。

GaussianAnything在Objaverse数据集上进行了大规模训练，并在文本、图像、点云引导的3D生成任务中超越了现有的原生3D生成方法。

GaussianAnything支持多模态可控的3D资产生成，通过使用文本、单目图像和稀疏点云作为输入条件，进行几何和纹理解耦的生成与编辑。

该研究解决了3D VAE输入格式、潜空间结构设计和输出表征选择等设计挑战，提升了3D生成模型的性能。

是的，GaussianAnything的所有模型和代码已开源至Github和Huggingface。

3D VAE编码器使用多视图RGB-D-N渲染图作为输入，提升了生成模型的性能。

🏷️

[开源] 阿里巴巴发布AI驱动的代码审查工具Open Code Review 帮助开发者审查代码
阿里巴巴开源了基于人工智能的代码审查工具Open Code Review（OCR），旨在解决传统审查中的覆盖不全、位置漂移和不稳定等问题。开发者可通过配置...
Roku LT OS开源解析：从遥控器系统到电动赛车控制平台
Roku开源了Roku LT OS，旨在为开发者提供轻量化架构和高度确定性的执行能力，适用于嵌入式设备和电动赛车。该系统强调资源控制和时间可预测性，已在电...
Crown Engine 0.63 恢复了其 OpenGL 渲染器，以支持旧版硬件
Crown Engine 0.63 是一款基于 C++ 的开源游戏引擎，新增 LOD 组组件以优化性能，并支持 OBJ 网格格式。更新改进了 FBX 导入...
MiniCPM5-1B采用RL+OPD训练，多项复杂任务达SOTA；面向复杂医疗业务自动化：医疗智能体评测数据集 CHI-Bench
TACK 是 AI Laboratory for Molecular Engineering 于 2026 年发布的一个标准化知识库数据集与基准测试集，旨...
我们在2026年5月发布的最新AI新闻
May AI recap
How OpenAI Built a Secure Windows Sandbox for Codex Agents
OpenAI details Codex Windows sandbox architecture, showing how SIDs, ACLs, re...