本研究提出了一个交互式框架,通过编码领域相关概念和专家反馈,平衡自动化与手动编码。该框架有效生成抽象概念的图像,并将主题概念引入图像字幕生成中,提升跨模态学习效果。同时,研究探讨了样式迁移、视觉概念转换和对比学习等方法,显著改善了图像生成和语言理解的表现。
完成下面两步后,将自动完成登录并继续当前操作。