小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断

CVPR 2026在丹佛举行,收到16092篇投稿,华人研究者表现突出。最佳论文D4RT实现动态场景的高效重建,最佳学生论文ChordEdit由广东工业大学等团队完成,展现了本科生的实力。华人在计算机视觉领域的贡献持续增加。

今年CVPR看点是广东:何恺明再获至高大奖,广工大打破大厂名校垄断

量子位
量子位 · 2026-06-06T07:00:06Z
减少高斯,增加纹理:4K前馈纹理喷溅

本文介绍了LGTM(Less Gaussians, Texture More)框架,旨在解决现有3D高斯点云方法在高分辨率合成中的局限性。LGTM通过预测紧凑的高斯原语及其纹理,实现了高保真4K视图合成,并显著减少了所需的高斯原语数量。此外,HUGS(Human Gaussian Splats)方法用于表示可动画的人类与场景,提升了动态场景的渲染效果。

减少高斯,增加纹理:4K前馈纹理喷溅

Apple Machine Learning Research
Apple Machine Learning Research · 2026-03-28T00:00:00Z
AI 生图精品提示词|第一期

文章讨论了使用Nano Banana Pro模型生成3D迷你商店的概念,展示了星巴克和麦当劳的创意设计,营造出迷人的城市氛围。还提到动态生成天气卡片和古诗意境的3D场景,强调细腻的建模和生动的视觉效果。

AI 生图精品提示词|第一期

Frytea's Blog
Frytea's Blog · 2025-12-06T06:47:00Z
AI 论文周报丨红队测试语言模型/多视角 3D 点追踪方法/蛋白质表示学习框架/密码学漏洞检测新框架……

苏黎世联邦理工学院与卡内基梅隆大学提出了一种新型数据驱动的多视角3D点追踪方法,能够在动态场景中通过少量相机实现鲁棒且精确的在线追踪,有效应对遮挡和复杂运动问题。

AI 论文周报丨红队测试语言模型/多视角 3D 点追踪方法/蛋白质表示学习框架/密码学漏洞检测新框架……

HyperAI超神经
HyperAI超神经 · 2025-09-15T08:12:45Z

本文全面综述了基于事件相机的3D重建技术,分析了不同输入方式和重建方法的现有成果,指出了数据可用性、评估和动态场景处理的局限性,并展望了未来的发展方向。

基于事件相机的 3D 重建调研:从事件驱动几何到神经 3D 渲染

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

本研究提出了一种利用单目连续波飞行时间(C-ToF)摄像头重建动态场景的方法,优化了场景几何表示,能够在受限条件下实现高保真的动态三维重建,尤其在快速运动场景中表现优异。

Gaussian Time-of-Flight: Indirect Depth Optimization in Dynamic Radiance Fields

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-08T00:00:00Z

本研究提出MASSeg模型,解决复杂视频物体分割中的小物体识别、遮挡处理和动态场景建模问题,利用MOSE+数据集和数据增强策略显著提升模型性能。

MASSeg:第四届PVUW MOSE赛道第二技术报告

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-14T00:00:00Z
小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians

本文介绍了一种名为Uni-Gaussians的仿真系统,旨在解决自动驾驶中相机与LiDAR联合仿真的问题。该系统利用高斯基元实现高效的动态场景模拟,显著提升了仿真质量和计算效率。实验结果表明,Uni-Gaussians在点云和图像渲染方面表现优异,提供了有效的解决方案。

小米汽车首曝自动驾驶研究:相机和LiDAR联合重建框架Uni-Gaussians

机器之心
机器之心 · 2025-03-25T02:26:39Z
突破:人工智能创造完美的动态人物和物体的3D视频,甚至在大空间中

该研究论文总结了WideRange4D项目,针对动态场景的4D重建挑战,创建了30个复杂运动场景的数据集,结合神经辐射场和人类跟踪技术,实现高质量重建,显著提升了时间和空间的一致性。

突破:人工智能创造完美的动态人物和物体的3D视频,甚至在大空间中

DEV Community
DEV Community · 2025-03-22T07:13:06Z

本研究提出了一种新方法4DGS-1K,旨在解决现有4D高斯散点技术在动态场景重建中的存储需求和渲染速度问题。该方法通过引入时空变化评分,显著降低了存储需求,并实现了超过1000帧每秒的渲染速度,同时保持了视觉质量。

4D Gaussian Splatting Technology for Dynamic Scene Rendering at 1000+ Frames Per Second

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

本研究提出了一种新的基于规则的决策框架,解决了传统方法在动态场景中的抖动和死锁问题,特别是在代理群体对抗中。该框架结合了概率有限状态机、深度卷积网络和强化学习,显著提升了代理的合作与竞争策略,实验结果表明其性能优于其他方法。

Application of Rule-Based Conflict-Free Decision Framework in Swarm Confrontation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z
ICLR 2025 Spotlight | 让城市「动」起来!DynamicCity突破4D大场景生成技术边界

DynamicCity是一个创新的4D场景生成框架,通过特征降维和扩散模型实现高质量动态场景生成,突破静态生成的局限。该项目由多所高校合作,支持可控生成,广泛应用于自动驾驶等领域。

ICLR 2025 Spotlight | 让城市「动」起来!DynamicCity突破4D大场景生成技术边界

机器之心
机器之心 · 2025-02-19T03:37:10Z

Meta推出的VideoJAM框架显著提升了运动一致性近20%,能够生成复杂的舞蹈和杂技等动态场景,效果接近真实。该框架在训练和推理阶段优化了DiT模型,采用联合外观-运动表示和内部引导机制,确保生成视频的运动连贯性。

Meta新视频生成框架拿捏倒立杂技,双人舞也能完美同步!运动一致性暴增近20%,可无缝集成DiT模型

量子位
量子位 · 2025-02-10T04:28:26Z

本研究提出了StreamChat框架,旨在解决现有视频理解模型在长视频、多轮对话和动态场景中的不足。通过分层记忆系统,StreamChat实现了高效的视频特征处理,实验结果表明其在准确性和响应时间上优于现有模型。

Stream Media Video Understanding and Enhanced Memory Knowledge for Multi-turn Interaction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-23T00:00:00Z

该研究提出了CatV2TON方法,旨在提升虚拟试穿技术在图像和视频中的质量。通过时间拼接衣物和人像输入,该方法在混合数据集上训练,显著改善了静态和动态场景下的虚拟试穿效果,展现出良好的应用潜力。

CatV2TON: Taming Diffusion Transformers for Vision-Based Virtual Try-On with Temporal Concatenation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-20T00:00:00Z
世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

AIxiv报道了李飞飞教授团队的研究,展示了通过单张图片生成三维物理世界的潜力。极佳科技与多方合作推出ReconDreamer,实现自动驾驶场景的高精度重建与生成,显著提升动态场景的渲染质量,推动自动驾驶技术发展。

世界模型进入4D时代!单视角视频构建的自由视角4D世界来了

机器之心
机器之心 · 2024-12-16T06:34:31Z

本研究提出了Driv3R框架,显著提高了自主驾驶中动态场景的实时4D重建速度和准确性,推理速度比现有方法快15倍。

Driv3R:用于自主驾驶的稠密4D重建学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种新方法,通过稀疏多视角事件流和RGB帧实现动态场景的时空重建,超越了RGB基线,取得了先进的效果。

Dynamic Event Neural Radiance Fields: Reconstructing General Dynamic Scenes from Multi-View Event Cameras

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出了一种新的动态场景表示方法SaRO-GS,旨在解决视频序列重建动态场景时的渲染速度慢和处理复杂性问题。该方法结合了尺度感知残差场和自适应优化策略,在实时渲染中展现出优越的性能。

4D Gaussian Splatting with Scale-aware Residual Field and Adaptive Optimization for Real-time Rendering of Complex Dynamic Scenes

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-09T00:00:00Z

本研究提出CAT4D方法,填补了从单目视频生成4D场景的技术空白。该方法结合多视角视频扩散模型和新采样技术,实现了精准的4D重建,并在新视角合成和动态场景重建方面表现出色。

CAT4D: Creating 4D Dynamic Scenes Using Multi-View Video Diffusion Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码