本研究提出了一种新的框架,通过利用3D食物模型和场景中的物理参考,从2D图像中估计食物的容量和能量。该方法通过重现具有估计姿态的食物的3D模型图像,来估计输入图像中摄像头和食物物体的姿态。我们还介绍了一个新的数据集,SimpleFood45,其中包含45种食物的2D图像和相应的注释,包括食物的容量、重量和能量。我们的方法在这个数据集上的平均误差为31.10千卡(17.67%),表现优于现有的分量估计方法。
该文章介绍了一种基于能量估计的跨域语义分割的自适应模型(SMART),利用自监督深度估计获得任务自适应特征,并通过能量评估方法提高深度引导的有效性。实验结果显示该方法显著提升了性能。
完成下面两步后,将自动完成登录并继续当前操作。