多视角超声心动图解读的视频CLIP模型

📝

内容提要

本研究解决了现有医学视觉语言模型在超声心动图解读中存在的单帧输入导致的诊断准确率低的问题。通过开发一种视频语言模型,利用五种不同视角和完整视频序列作为输入,并在60747个病例的超声视频与临床报告对上进行训练,结果显示该模型的解读准确率显著高于仅使用单视角视频或静态图像的模型。

🏷️

标签

➡️

继续阅读