该研究提出了一种新方法,通过自适应提示调优增强CLIP模型,利用交叉注意力机制动态调整文本提示,实现图像与文本特征的精确对齐,显著提升模型性能和预测可靠性。
该研究探讨了大型语言模型中成员推断攻击(MIA)性能不一致的原因,发现样本分布差异是关键因素,并分析了模型规模和文本特征等对MIA准确性的影响,提出了改进建议。
本研究解决了土耳其情感分析数据集稀缺的问题,系统评审了2012至2022年间的研究,收集了23个公开数据集,并分类了31项研究,发现不同文本特征下情感分析工具的性能差异显著。
本研究提出了一种新模型,通过结合用户特征与文本特征,显著提升了社交媒体上英语仇恨言论的检测效果。
本研究分析了卡尔德隆非宗教作品中的性别描绘,发现男女角色存在显著差异,并通过量化方法识别影响性别分类的文本特征,具有重要的文化分析价值。
本研究提出了一种新方法,解决小样本实例分割的高耗时和数据集依赖问题。通过生成伪标签和整合图像、文本特征,提高了分割性能,减少了对预训练的依赖。实验结果表明,该方法在多种场景中表现优越。
该研究使用声学和文本特征对语言情感进行分类。使用BERT获取情感转录中的上下文化词嵌入,结果比使用Glove嵌入更好。融合声学和文本系统对于分类有益。交叉验证折叠的标准方法对结果有巨大影响,先前的作品可能夸大了结合转录的优势。
本文介绍了一种名为STA的双流注意力网络,用于视频问答。该网络能够识别视频中的长时空结构和文本特征,并将视觉和文本信息融合,提供准确答案。在TGIF-QA数据集上的实验结果显示,STA在Action、Trans、TrameQA和Count任务上表现最佳,分别提高了13.0%、13.5%、11.0%和0.3%。此外,在Action、Trans和TrameQA任务上,STA的表现也比竞争对手提高了4.1%、4.7%和5.1%。
完成下面两步后,将自动完成登录并继续当前操作。