💡 原文中文,约4200字,阅读约需10分钟。
📝

内容提要

在FPGA 2025会议上,无问芯穹与上交、清华团队的FlightVGM获得最佳论文奖,成为首个由中国大陆团队获此荣誉。该研究实现了视频生成模型的高效推理,在AMD V80 FPGA上性能较NVIDIA 3090 GPU提升1.30倍,能效提升4.49倍。FlightVGM通过稀疏化和混合精度技术优化计算效率,展示了FPGA在视频生成领域的潜力。

🎯

关键要点

  • 无问芯穹与上交、清华团队的FlightVGM获得FPGA 2025最佳论文奖,成为首个由中国大陆团队获此荣誉。
  • FlightVGM在AMD V80 FPGA上实现了视频生成模型的高效推理,性能较NVIDIA 3090 GPU提升1.30倍,能效提升4.49倍。
  • 该研究通过稀疏化和混合精度技术优化计算效率,展示了FPGA在视频生成领域的潜力。
  • 论文第一作者刘军是上海交通大学博士生,通讯作者汪玉和戴国浩分别是清华大学和上海交通大学的教授。
  • 视频生成领域的计算需求高,如何提升生成效率成为关键问题。
  • FlightVGM引入视频压缩技术的思想,通过激活值在线稀疏化、混合精度架构和自适应调度策略解决计算挑战。
  • FlightVGM的激活稀疏化方法通过动态跳过相似部分计算,显著降低计算负载。
  • 混合精度DSP58拓展架构允许在运行时配置,最大化计算性能。
  • 实验结果显示,FlightVGM在模型精度和性能上均优于基准模型,且在能效上超过NVIDIA 3090 GPU。
  • 未来FPGA有望通过新架构为视频生成任务提供更高效的计算支持,成为重要计算平台。
➡️

继续阅读