2024年国际人工智能顶会录用3,032篇论文,录取率为23.4%。昆明理工大学与中国海洋大学的研究团队提出了一种新型未对齐医学图像融合方法BSAFusion,解决了多模态医学图像的特征对齐和融合问题,显著提升了诊断效率,对医学影像处理领域具有重要意义。
本文探讨了语音识别中声学模型与语言模型的融合方法,包括浅层融合、语言模型重评分、密度比和内部语言模型估计等。这些融合策略能够提高识别精度并降低计算开销。
本研究提出了一种新的动态图像融合方法,有效解决了多源图像的相关性捕捉和信息整合问题。实验结果表明,该方法能够动态突出每个源的主导区域,实现稳健的融合效果。
通过比较音频和视觉模型以及融合方法,研究了深度学习的多模态微笑和笑声分类系统。结果表明融合方法在未知数据上具有更好的泛化性能。同时发现微笑和笑声的强度水平之间的关系较复杂,需要采用更复杂的方法进行处理。迁移学习可以改善混淆强度水平的检测问题,解决资源有限的挑战。
该研究通过引入AYDIV框架和多种融合方法,提高了自动驾驶系统中近距离物体检测的效果。实验结果在两个数据集上表现优于其他方法,mAPH值提升1.24%,AP值提升7.40%。
本文介绍了红外和可见光图像融合中使用深度学习的方法和评估指标,包括基于GAN的方法和面向检测的融合方法TarDAL和IFCNN。评估指标包括EN、SSIM、PSNR、SD、CC、SF和VIF等。文章还提到了使用的数据集和实际应用场景。
该文介绍了一种创新的红外和可见图像融合方法AMFusionNet,通过使用多个卷积核和注意力机制,吸收红外图像的热力细节和可见源的纹理特征,生成了丰富信息的图像。实验证明,该方法在质量和数量上优于现有算法,并在公开可用数据集上显示了显著的改进。
本文利用深度神经网络融合单眼图像和雷达数据点,实现更准确的深度估计。通过对不同角度的RGB图像和雷达测量的融合进行研究,提出了一种有效的解决方案。实验结果表明,该方法优于现有的融合方法,并提供了详细的剖析研究以展示各组成部分的有效性。
本文提出了一种融合方法,通过将全局纹理与局部基于图像块的信息相结合来解决精细化图像分类问题。该方法在人脸、皮肤病变、美食、海洋生物等八个数据集上进行了测试,并在分类准确率上取得了显著提升。
本文讨论了预测股票价格的挑战性问题,介绍了利用外部知识进行股票价格预测的方法。文章将外部知识分为非图形化格式和图形化格式,并综合了以前的研究工作。文章描述了从非结构化数据源中获取外部知识并纳入股票价格预测模型的方法,探索了将外部知识与历史价格特征相结合的融合方法。此外,文章还提供了相关数据集的汇编,并讨论了未来研究方向。
完成下面两步后,将自动完成登录并继续当前操作。