本研究探讨了机器生成图像描述评估的复杂性,分析了现有评估方法的优缺点,指出当前指标在适应多模态大语言模型生成的长篇描述时的局限性,并提出未来研究方向。
本文提出了一种跨语言机器自动事实到文本生成的方法,利用Transformer模型和多语言数据集XALIGNV2,取得了优异成果。研究展示了无监督对齐方法在低资源语言中的有效性,并通过迁移学习和多语言学习提升了模型性能。同时,针对低资源语言的语音合成和自动语音识别,提出了知识迁移和数据增强的方法,显示出良好的效果。
完成下面两步后,将自动完成登录并继续当前操作。