小红花·文摘

DeepHQ：学习型层次化量化器用于渐进式深度图像编码 | TOMM 2026

实时互动网 ·

面向机器视觉的数据编码（DCM）正式获批国家标准立项，驱动产业创新发展

实时互动网 ·

我在研究Step1X-Edit扩散模型，该模型通过vlm编码文字指令和图像，提供高效的图片编辑解决方案。文章详细描述了模型的执行流程，包括图像编码、降采样、噪声构建和去噪过程，旨在分享对该模型的理解和应用。

Step1X-Edit执行流程（一）

李文举 ·

“AI+图像编码”赛道介绍 | 全国人工智能大赛开放报名中

实时互动网 ·

本文介绍了一种新型图像编码方案，结合压缩模型与生成模型，旨在提升编码效率与视觉识别准确性。研究探讨了视频编码对视觉识别任务的影响，并提出了优化图像压缩与视觉分析的模型。

机器视觉感知的压缩图像和视频评估质量指标

BriefGPT - AI 论文速递 ·

AV1 静态图像编码已合并至 Mesa 24.3 Radeon 驱动程序

实时互动网 ·

本文研究多视图图像压缩中的问题，现有方法在视差较大时效果不佳。我们提出了一种基于学习的3D高斯几何先验的多视图图像编码方法，能够更准确地估计视差，并通过深度图压缩模型减少视图之间的冗余信息。实验表明，该方法在性能上优于传统和学习基础的方法，同时保持快速的编码和解码速度。

基于学习的多视图图像编码与3D高斯几何先验

BriefGPT - AI 论文速递 ·

本文介绍了一种交叉模态检索系统，利用图像和文本编码实现高效检索，避免了使用不同网络的缺点。该系统在多个数据集上评估，展示了在视频和图像检索中的优越性能，并在电子商务平台Shopee中显著提升了用户点击和订单量。

智能多模态搜索：Adobe Express中上下文稀疏与密集嵌入的结合

BriefGPT - AI 论文速递 ·

本文介绍了一种新颖的图像压缩方法，结合非线性分析变换、均匀量化器和非线性合成变换，优化了速率失真性能。高位和极低位量化方法在深度信息利用上表现出色，并在图像检索和识别中优于现有技术。此外，研究展示了基于向量量化的生成模型和创新的PTQ算法，提升了压缩比和训练效率。

DeepHQ：用于渐进式深度图像编码的学习层次量化器

BriefGPT - AI 论文速递 ·

本研究针对传统图像压缩方法未能满足机器智能任务的需求，提出了一种新颖的图像编码框架ICM，通过利用大规模多模态模型（LMMs）的语义理解能力，在压缩前解耦图像内容，从而实现更符合下游任务需求的编码。该方法“SDComp”显示出更灵活的重建结果和优越的视觉质量，能够有效支持多种视觉分析任务。

告知编解码器值得压缩的内容：面向机器的语义解耦图像编码

BriefGPT - AI 论文速递 ·

本研究提出了新的图像编码框架Prompt-ICM，解决了压缩策略调整和特征适应性问题，支持高效智能任务。通过深度卷积神经网络实现超分辨率重建和伪影去除，表现优异。设计的基于提示学习的恢复网络在盲目压缩图像增强挑战中获得第一名。新的视频超分辨率模型有效恢复高分辨率内容，并在超分辨压缩视频方面表现出色。

UCIP: 基于动态提示的压缩图像超分辨率通用框架

BriefGPT - AI 论文速递 ·

PO-ELIC提出了一种高效的图像编码模型，利用对抗性训练技术提升感知品质。研究中介绍了上下文自适应熵模型、空间-通道自适应编码算法及平行化友好的上下文模型，显著提高了图像压缩性能。实验结果表明，这些方法在PSNR和MS-SSIM指标上优于传统编解码器，具有更好的压缩效率和速度。

重新思考学习图像压缩：上下文是你所需的全部

BriefGPT - AI 论文速递 ·

通过分析电磁波对降雨的影响，以及其对移动网络性能的影响，本文提出了一种将时间序列数据编码为图像并利用卷积神经网络作为图像分类问题的新方法，以解决在 4G/LTE...

一种用于天气现象分类的新型时间序列转图像编码方法

BriefGPT - AI 论文速递 ·

本文介绍了一种新型图像编码方案，结合压缩模型和生成模型，支持机器视觉和人类视觉感知。研究重点在生成任务和3D内容操作，提出了音频视觉语音增强系统，利用扩散模型改善语音质量。同时探讨了生成对抗网络在社会过程研究中的应用，以及深度学习在超分辨率图像和视频中的进展，强调未来的挑战与机遇。

基于生成模型的视觉信号编码与处理调查：技术、标准与优化

BriefGPT - AI 论文速递 ·

本文研究了一种可扩展的图像和视频编解码器，结合机器视觉与人类视觉，旨在提高图像压缩效率并降低比特率。通过特征融合和条件编码，提出的新方法在物体检测和人类视觉任务中表现优越，提供了人机协同压缩的新见解。

基于 CNN 的图像编码在人类视觉层进行后期处理

BriefGPT - AI 论文速递 ·

本文研究了一种可扩展的图像编解码器，旨在提高机器视觉任务的比特率效率，同时保持人类视觉感知的性能。该方案结合了压缩模型和生成模型，在物体检测和图像重建方面表现优异，显著节省比特率并优化任务准确性。实验结果表明，该模型在视频监控和图像压缩中具有良好性能，提供了人机协同压缩的新见解。

基于特征融合网络的人机可扩展图像编码

BriefGPT - AI 论文速递 ·

本文探讨了大型语言模型（LLMs）在医学图像分析和多模态任务中的应用，评估其在生物医学领域的性能。研究表明，LLMs在小样本数据集上表现优于传统模型，且无需微调即可理解视觉信号。通过创新的图像编码方法，LLMs在图像识别、生成和多模态对话等任务中展现出潜力。

语言模型对生物医学成像任务的免费助推器

BriefGPT - AI 论文速递 ·

本研究提出了一种基于深度学习的图像压缩模型，旨在提高图像编码的视觉质量和机器分析准确性。通过对抗训练和自我监督学习，该模型在物体检测和语义分割任务中显著提升了性能，并减少了比特率需求。实验结果表明，该技术有效消除了伪影，在多个视觉任务中表现优越。

利用边缘信息学习的机器图像编码

BriefGPT - AI 论文速递 ·

该研究提出使用神经网络辅助的额外lifting步骤来增强传统小波变换中的冗余性，提高降低分辨率后重建图像的视觉质量。应用于JPEG 2000图像编码标准中，能够在广泛的比特率范围内实现高达17.4%的平均BD比特率节省，同时保持JPEG 2000的质量和分辨率可扩展特性。

基于神经网络的提升步骤，以改善 JPEG 2000 中的完全可扩展有损图像压缩

BriefGPT - AI 论文速递 ·

本研究提出了一种基于对抗训练的图像编码技术，提高视觉质量，保持机器分析准确性，无需增加比特率或参数。实验证明，该技术消除棋盘格伪影，提高像素和特征保真度分数。

通过辅助损失优化编码器提高机器图像编码

BriefGPT - AI 论文速递 ·