本研究提出Surg-FTDA方法,旨在减少外科工作流程分析对大规模标注数据集的依赖。该方法能够在少量配对数据下处理多种任务,并在生成性和区分性任务中优于基线表现。
本文介绍了使用可缩放矢量图形(SVG)格式处理图像的新方法,以弥合视觉和文本模态之间的鸿沟,并展示了其在鉴别性和生成性任务上的潜力。
完成下面两步后,将自动完成登录并继续当前操作。