本研究提出了一种检索增强的大型多模态模型,旨在解决食谱生成中的“幻觉”问题。通过随机多样化检索增强技术和自一致性集成投票机制,提升了Recipe1M数据集的生成性能。
本文介绍了一种结合视觉和文本数据的跨模态检索模型,验证了其在Recipe1M数据集上的优越性能。同时,提出了“RecipeQA”数据集,旨在提升计算机对多模态烹饪配方的理解能力。此外,研究探讨了生成AI在食品计算模型中的应用,提出了新的生成方法Cook-Gen,并开发了基于神经网络的编码器-解码器模型以优化食品制作流程。
完成下面两步后,将自动完成登录并继续当前操作。