本文提出了一种无训练的上下文学习方法EmoGist,用于视觉情感分类,解决情感标签的上下文依赖性问题。通过分析类别示例图像的聚类,预生成情感标签解释,从而提高分类准确性。实验结果显示,EmoGist在多个数据集上的F1分数显著提升。
本研究提出CRAT多代理翻译框架,旨在提高大型语言模型在机器翻译中对上下文依赖词汇的翻译准确性。通过因果增强的自我反思和检索技术,CRAT在处理复杂上下文的新术语时表现出色。
研究探讨了新加坡英语词性标注的挑战,通过建立平行数据集和设计特定标注方法,提高标注准确度,揭示方言多样性和上下文依赖性对标注的影响。
本文提出了一种新的音频描述生成模型Uni-AD,利用预训练模型和多模态输入,解决电影音频描述中的上下文依赖问题。通过引入角色细化模块和对比损失,Uni-AD在生成质量上显著提升。同时,研究开发了新的数据集和评估指标,推动了音频描述技术的发展。
本文介绍了一种基于深度神经网络的医学图像分割方法,采用“拐杖”网络连接和自适应深度监督策略,显著提升了目标定位和分割性能。该方法在多模态数据集上验证,能够有效捕捉上下文依赖关系,强调相关特征,从而提高医学图像的分割效果。
完成下面两步后,将自动完成登录并继续当前操作。