小红花·文摘

本研究提出了多种自适应融合网络和动态融合方法，显著提升了多模态机器翻译和情感识别的效果。通过特征融合策略和多模态模型，改善了情感分析和图像描述的质量，验证了多模态融合在分类准确性和模型鲁棒性方面的优势。

基于上下文的多模态融合

BriefGPT - AI 论文速递 ·

研究发现，CLIP和DINO在细粒度任务和MLLMs中表现出优势和有希望的性能。研究提出了特征融合策略COMM，将CLIP和DINO结合起来，增强MLLMs的视觉能力。实验证明COMM在MLLMs中具有卓越性能。

统一目标圈定与检测的开放和全面流程

BriefGPT - AI 论文速递 ·

本研究提出了任务感知的指令网络TIN-SLT，用于手语翻译。通过引入指令模块和特征融合策略到Transformer网络中，利用预训练模型的语言能力提高翻译性能。同时，通过多级数据增强方案调整训练集的数据分布。在PHOENIX-2014-T和ASLG-PC12数据集上进行实验，方法在BLEU-4方面的表现优于以前的解决方案。

迭代原型的手语翻译

BriefGPT - AI 论文速递 ·