横跨印度语言的文本图像生成偏见导航
原文中文,约500字,阅读约需2分钟。发表于: 。该研究旨在调查印度各地通用的印度语中文本到图像 (TTI) 模型的偏见。使用所提出的 IndicTTI 基准,综合评估了英语和这些语言中领先的 TTI 模型的生成性能和文化相关性。该基准的主要目标是评估这些模型对印度语言的支持,并确定需要改进的领域。该基准旨在提供对 Indic 语言景观中 TTI 模型的有效性进行详细而深入的分析,考虑到 30 种语言的语言多样性,人口超过 14 亿。
该论文介绍了为11种印度语言引入神经信息检索资源的工作,包括使用机器翻译创建的数据集和神经信息检索模型集合。实验证明,该资源在多种印度语言上取得了显著改进。