机器之心 ·

美图奇想大模型全新升级：生成能力、生成效率、模型性能实现三重进阶

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

美图公司升级了美图奇想大模型的视频生成能力，提升了生成效率和画质，支持1分钟1080P视频输出。新技术采用DiT架构，解决了主体一致性问题，并已应用于多款产品，提升用户体验。

🎯

关键要点

美图公司升级了美图奇想大模型的视频生成能力，提升了生成效率和画质。
新技术支持1分钟1080P视频输出，单次文生视频和图生视频时长均达5秒。
美图奇想大模型结合对特征的大范围提取，实现艺术风格与细节把控的平衡。
视频生成能够重现真实物理规律，支持大幅度流畅运动。
美图奇想大模型于2023年6月上线，2024年1月通过国家备案，2024年6月迭代至V5版本。
此次升级解决了主体一致性、运动连贯性和物理逻辑合理性等核心问题。
新的视频生成能力已应用于美图旗下多个产品，提升了应用深度与广度。
美图奇想大模型以用户需求为驱动，追求用户体验与技术进步的平衡。

❓

延伸问答

美图奇想大模型的最新升级主要提升了哪些方面？

美图奇想大模型的最新升级主要提升了视频生成能力、生成效率和模型性能。

美图奇想大模型支持的视频输出规格是什么？

美图奇想大模型支持1分钟、帧率24FPS、分辨率1080P的视频输出。

美图奇想大模型如何解决视频生成中的主体一致性问题？

美图奇想大模型通过新的技术路线，解决了主体一致性、运动连贯性和物理逻辑合理性等核心问题。

美图奇想大模型的升级对用户体验有什么影响？

升级后，美图奇想大模型提升了用户体验与效率，深化了在电商、广告、游戏等领域的应用。

美图奇想大模型的应用范围有哪些？

美图奇想大模型已应用于美图秀秀、美颜相机、Wink等多个产品，覆盖视频工具赛道的深度与广度。

美图奇想大模型的技术架构有什么特点？

美图奇想大模型采用Diffusion与Transformer模型结合的全新技术路线，具备高度可复用的模块化能力。

🏷️

标签

1080P DiT架构大模型用户体验美图公司视频生成

➡️

继续阅读

伊朗声称使用巡航导弹摧毁亚马逊AWS巴林数据中心不过目前全是AI图无法分辨真伪
#云计算伊朗声称使用巡航导弹成功摧毁亚马逊 AWS 巴林数据中心，不过目前全是 AI 图无法分辨真伪。正常来说只要发生袭击肯定会有现场居民拍照发网上，只...
OpenAI官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台HuggingFace
#安全资讯 OpenAI 官方证实内部测试模型越狱并自主挖掘漏洞入侵开源平台 Hugging Face，这起黑客攻击事件源头竟然是 OpenAI 测试模型...
法院批准A社与作者和出版社的15亿美元和解协议初步解决A社使用盗版图书训练模型问题
#人工智能法院批准 A 社与作者和出版社的 15 亿美元和解协议，初步解决 A 社使用盗版书籍训练模型的集体诉讼案件。法庭文件显示，A 社建立拥有 70...
华为云高校公开课走进中山大学，聚焦智能体时代企业级开发能力建设
7月13日，华为云开发者发展与运营部部长林华鼎受邀走进中山大学深圳校区电子与通信工程学院，为30名学生带来《AI编程实战：重构学习生活，洞见企业级开发》专...
有传言称谷歌正在研发名为Frozen v2的芯片将AI模型部分蚀刻到芯片上提高吞吐量
#人工智能谷歌也尝试将模型权重直接蚀刻到硅晶片中，谷歌正在研发的 Frozen v2 芯片 token 吞吐量是谷歌现有 TPU 单元的 6~10 倍。...
小红书大模型IMO满分夺金，第三题解法让冠军选手直呼优雅
中国大模型首次获得IMO官方金牌水平认证