CaLoRAify:基于视觉-文本配对和LoRA驱动的卡路里估计
📝
内容提要
本研究解决了传统卡路里估计工具在现实场景中实用性不足的问题。通过构建CalData数据集,并提出CaLoRAify框架,利用视觉-文本配对进行原料识别与卡路里估计。研究表明,该方法允许用户只需单张食物图像即可准确估计卡路里,具有很高的实用潜力。
🏷️
标签
➡️