本研究提出了一种多尺度跨模态融合网络(MSFNet-CPD),旨在提高农业害虫识别的准确性。该方法结合视觉和文本特征,并构建了两个新数据集(CTIP102和STIP102)。实验结果表明,MSFNet-CPD在多个检测基准上优于现有技术,展现出良好的应用潜力。
本研究建立了多类型深度伪造音频检测基准,采用波形提示调优的自监督学习方法,优化检测效果,平均错误率为3.58%。
本文提出了医疗幻觉检测基准MedHallu,包含1万对问答。研究表明,现有模型在幻觉检测方面表现不足,引入领域知识和“无确定答案”选项可显著提升检测精度。
完成下面两步后,将自动完成登录并继续当前操作。