本研究提出了一种名为Biomed-DPT的双模态提示调优技术,旨在提升生物医学图像分类的提示学习效果。通过结合临床提示、领域适应提示和视觉提示中的零向量软提示,该方法显著提高了分类准确率。
本研究提出了CDUPatch,解决了双模态对抗补丁攻击在不同物理场景中的有效性不足问题。通过颜色变化引起的热量吸收差异,实现了跨模态补丁的统一优化,实验结果表明该方法在真实环境中表现优异。
本研究提出了ChatTime模型,解决了传统深度学习模型在时间序列分析中仅依赖数值数据的问题。该模型支持双模态输入/输出,实现零样本预测,实验结果显示其在多项任务中表现优越,具有潜在应用价值。
本研究提出了一种名为BAMBA的双模态对抗多轮黑盒越狱攻击者,克服了现有攻击方法的局限性。实验结果表明,BAMBA在多种语言视觉模型上表现优于其他方法,具有重要的实用价值。
本研究提出了一种深度傅里叶嵌入网络(DFENet),利用快速傅里叶变换解决双模态显著目标检测中的计算复杂度和频率差距问题。DFENet通过模态协调感知注意机制和频率分解边缘感知模块,在四个基准数据集上超越了十二个现有模型。
本文介绍了RELATE平台的设计与演变,旨在满足罗马尼亚语自然语言处理的高性能需求,支持文本和音频处理,展示了在国家和国际研究项目中的应用,强调双模态功能,展现了现代化平台的潜力。
本研究提出了一种基于双模态循环神经网络的音视频系统,用于在嘈杂环境中进行语音活动检测,实验结果显示其检测效果优于传统深度神经网络,F1评分达到92.7%。此外,研究还探讨了机器学习在儿童虐待检测和声音事件识别等领域的应用,展示了新数据集和模型的有效性。
完成下面两步后,将自动完成登录并继续当前操作。