该文章介绍了一个新的图像质量评估(IQA)数据集,包括6073个高分辨率的4K图像,填补了现有数据集的空白。该数据集通过众包研究获得感知质量评级,具有高质量图像、可靠的众包注释和高分辨率注释等特点,为感知图像质量评估研究和开发非参考IQA模型提供了新的机会。
本论文研究对话式信息获取中的答案重写方法,通过创建带有实体注释的对话数据集,发现答案中包含重要实体。提出了两种答案重写策略,通过内联定义或补充后续问题来改善用户体验。众包研究结果表明,重写后的答案优于原始答案。内联定义往往优于后续问题,为个性化提供了未来方向。
本文通过众包研究比较了DALL.E 2和Stable Diffusion模型在生成普通名词图像时的全球表现。结果显示,对于没有特定国名的输入,生成的图像在美国和印度表现最好。当指定国家名称后,两个模型的表现有所提升,但仍有许多国家得分较低,需要未来模型更加包容。此外,研究还探讨了在不进行用户研究的情况下量化生成图像在地理上的代表性的可行性。
完成下面两步后,将自动完成登录并继续当前操作。