本研究提出了一种结合关键数据嵌入的混合生成语义通信系统,解决了视觉细节缺失和评估指标不足的问题。通过语义过滤选择相关图像特征,并引入生成视觉信息保真度(GVIF)指标,实验结果表明该系统在视觉保真度上优于现有方案。
本研究提出Concat-ID框架,旨在解决身份保持的视频生成问题。该框架利用变分自编码器提取图像特征,并结合视频潜变量,实现连贯的视频生成。研究表明,Concat-ID在单一和多身份生成中表现优越,具有广泛的应用潜力。
本研究提出FOCUS框架,解决前景分割方法缺乏统一性的问题。通过多尺度语义网络和新颖的蒸馏方法,提升图像特征和分割效果。实验结果表明,FOCUS在多个任务上优于现有模型。
该研究提出了ORFormer方法,通过可学习的信使标记聚合图像特征,解决了人脸关键点检测在部分遮挡下的性能下降问题。实验结果表明,ORFormer在复杂数据集上表现优异。
本研究提出了一种名为DEPICT的方法,结合语义分割与压缩,通过自注意力和交叉注意力构建主空间,有效提取图像特征,性能优于现有方法,且更轻量和鲁棒。
本文介绍了多种视觉地理定位方法,包括基于图像特征的聚类算法、多任务架构合成街景、众包数据基准测试以及新型GeoWarp图像匹配方法。这些研究在多个数据集上取得了先进的定位性能,并提出了新的大规模数据集OpenStreetView-5M,展示了图像定位的实用性和效果。
本文介绍了多种神经渲染方法,如MVSNeRF、NeRFusion和SparseNeuS,旨在通过稀疏视图重建高质量3D场景。这些方法结合几何推理和图像特征,提高了重建速度和质量。此外,提出的可泛化神经辐射场(GPF)和Omni-Recon框架展示了在不同3D任务中的应用潜力,推动了神经场技术的发展。
本文探讨了通过局部差分隐私实现图像特征私有化的方法,提出了新的反演攻击技术,证明可以恢复原始图像特征。研究表明,该方法在视觉定位任务中表现优异,同时保证隐私保护,缩小了私有与非私有图像分类之间的精度差距。
本文介绍了多种基于三维片段和图像特征的闭环检测与定位方法,如SegMatch、GoMatch和GeoWarp。这些方法在大规模非结构化环境中实现了高效的定位和闭环检测,显著提高了准确性和实时性,适用于视觉SLAM和地理定位等领域。
人工智能在癌症诊断方面有潜力,研究提出了一种从图像特征构建文本提示的方法,改善了性能。合成数据有效地训练人工智能模型,病理学家难以检测到合成图像。
本文提出了一种新的方法,通过从图像提取特征直接预测光流,同时考虑到光流估计的运动学视角和外观视角,解决了由于运动不准确造成的误差及遮挡问题,并通过自监督损失函数将运动特征与外观特征相结合,实验证明该方法在光流预测上表现优于现有方法,尤其在包含遮挡和快速运动的情况下效果更好。
该研究通过生成反检索通用对抗扰动来攻击图像检索系统,降低相关排名度量,破坏图像特征之间的邻域关系。评估四个图像检索数据集发现显著性能下降。在Google Images上的实际测试证明了该方法的潜力。
人工智能在癌症诊断方面有潜力。研究提出了一种从图像特征构建文本提示的方法,改善了性能。合成数据有效地训练人工智能模型。
本文通过分析电影镜头中的图像特征,对性骚扰、性虐待和性暴力进行了分类。研究发现面部表情和接触是关键因素。已有的内容检测器无法识别这类图像,因此研究开发了适用于深度学习的数据集。该数据集基于印度电影场景,可用于研究和开发。
人工智能在癌症诊断方面有潜力,研究提出了一种从图像特征构建文本提示的方法,改善了性能。合成数据有效地训练人工智能模型,病理学家难以检测合成图像。
本文介绍了DINO-Mix架构,通过DINOv2模型提取鲁棒的图像特征。实验证明,DINO-Mix在具有光照变化、季节变化和遮挡的测试集上表现优于当前最先进的方法,准确率提高了5.14%。
通过研究22种家用游戏主机系统的单个截图,发现CNN在提取图像特征和识别游戏标题方面具有能力。EfficientNetB3表现最佳,平均准确性为74.51%,DenseNet169在14个系统中表现出色。使用替代初始权重提高了EfficientNetB2和EfficientNetB3的准确性,后者达到了最高准确性76.36%。通过优化架构和权重的组合,主要由EfficientNetB3在19个系统中领先,实现了77.67%的准确性。这些发现强调了CNN在视频游戏识别方面的有效性。
本文介绍了DINO-Mix架构,利用DINOv2模型修剪和微调图像,提取鲁棒的特征。实验证明,DINO-Mix在具有光照变化、季节变化和遮挡的测试集上表现优于当前最先进的方法,准确率提高了5.14%。
该研究提出了一种运动员再识别系统,能够自动识别跑步者并提取其图像特征,通过动态特征提取方法提高准确性。在跑步实践视频数据集上的评估中,该系统表现优于最先进的模型,具有实用价值。
该研究提出了一种新的特征重新缩放方法来解决 StyleGAN 图像合成中的 Feature Proliferation 现象,该方法在更低级的特征空间中识别和调节风险特征,相比于截断技巧而言更精细且保留了更多有用的图像特征。实验证明了该方法的有效性。
完成下面两步后,将自动完成登录并继续当前操作。