小红花·文摘

本研究评估了六种视觉-语言模型在食品图像识别中的能力，提出了食品图像数据库FoodNExTDB，并引入专家加权召回率作为评估指标。结果表明，封闭源模型在简单食品识别中表现良好，但在细粒度识别上仍存在困难，影响其在自动饮食评估中的可靠性。