小红花·文摘

本文探讨了视觉化语言生成中样本方差对模型性能的影响，强调多样性的重要性，并提出CIDEr作为有效的评价指标。同时，分析了自动评估的局限性，提出了新的比较模型和评估建议，以提升生成模型的评估质量和公平性。