小红花·文摘

腾讯推出混元图像2.0，实现边说边画的实时图像生成，响应速度达到毫秒级。用户可通过文字或手绘输入，系统即时生成图像。该模型具备更大参数和高效图像编解码器，提升了生成效果和真实感。

量子位 ·

本文研究了一种可扩展的图像编解码器，旨在提高机器视觉任务的比特率效率，同时保持人类视觉感知的性能。该方案结合了压缩模型和生成模型，在物体检测和图像重建方面表现优异，显著节省比特率并优化任务准确性。实验结果表明，该模型在视频监控和图像压缩中具有良好性能，提供了人机协同压缩的新见解。

BriefGPT - AI 论文速递 ·