本研究探讨了大型视觉-语言模型在外科图像理解中的应用,发现其在泛化能力和上下文学习方面表现优异,但在空间和时间推理任务上仍显不足,为未来的应用提供了重要见解。
完成下面两步后,将自动完成登录并继续当前操作。