小红花·文摘

本研究探讨了机器生成图像描述评估的复杂性，分析了现有评估方法的优缺点，指出当前指标在适应多模态大语言模型生成的长篇描述时的局限性，并提出未来研究方向。

Image Captioning Evaluation in the Era of Multimodal Large Language Models: Challenges and Future Perspectives

BriefGPT - AI 论文速递 ·

本文提出了一种跨语言机器自动事实到文本生成的方法，利用Transformer模型和多语言数据集XALIGNV2，取得了优异成果。研究展示了无监督对齐方法在低资源语言中的有效性，并通过迁移学习和多语言学习提升了模型性能。同时，针对低资源语言的语音合成和自动语音识别，提出了知识迁移和数据增强的方法，显示出良好的效果。

Triples-to-isiXhosa (T2X): 解决低资源凝聚词语数据到文本生成的挑战

BriefGPT - AI 论文速递 ·