本研究针对 SemEval-2025 任务 1 中的挑战,即根据给定名词复合词对图像进行排序,采用了生成性大语言模型和多语言 CLIP 模型,以增强习惯用语复合词的表示。研究发现,通过这种方法提取的多模态表示优于仅基于原始名词复合词的表示,显示了该方法在多语言环境下的潜在应用价值。
本研究分析了大型语言模型(LLMs)在理解习惯用语时的局限性,强调了上下文的重要性。研究发现,LLMs在依赖语境进行消歧义时常常失效,其性能受到表达频率和句子概率的影响。这对提升模型处理习惯用语的能力具有重要意义。
完成下面两步后,将自动完成登录并继续当前操作。