本研究提出了一种新的单阶段双模态变压器框架,用于手术室中的场景图生成。该方法通过视图同步转运方案,整合2D和3D视觉信息,直接预测实体对关系的图生成,具有卓越性能和较低计算成本。
完成下面两步后,将自动完成登录并继续当前操作。