量子位 ·

36.4万超声图文对！中国团队构建首个大规模超声专属数据集，让AI真正读懂临床诊断语义丨CVPR’26

💡 原文中文，约3500字，阅读约需9分钟。

📝

内容提要

浙大城市学院等团队构建了首个专用超声图像-文本数据集US-365K，解决了超声影像领域的数据缺口和语义模糊问题。提出的Ultrasound-CLIP框架通过结构化推理和双目标优化，提升了超声诊断的准确性和模型的泛化能力，相关成果已开源，为超声AI研究奠定基础。

🎯

关键要点

浙大城市学院等团队构建了首个专用超声图像-文本数据集US-365K，解决了超声影像领域的数据缺口和语义模糊问题。
US-365K数据集包含36.4万对超声图像-文本样本，覆盖全解剖区域，是业内首个100%专属超声的大规模图文数据集。
提出的Ultrasound-CLIP框架通过结构化推理和双目标优化，提升了超声诊断的准确性和模型的泛化能力。
Ultrasound-CLIP框架创新融入UDAF引导的异质图编码器和基于UDAF的语义软标签，突破了通用模型的局限。
团队已将研究相关的代码和US-365K数据集公开，为后续研究者提供可直接复用的基础资源。

❓

延伸问答

US-365K数据集的主要特点是什么？

US-365K数据集包含36.4万对超声图像-文本样本，覆盖全解剖区域，是业内首个100%专属超声的大规模图文数据集。

Ultrasound-CLIP框架如何提升超声诊断的准确性？

Ultrasound-CLIP框架通过结构化推理和双目标优化，提升了超声诊断的准确性和模型的泛化能力。

为什么超声影像领域存在数据缺口？

超声样本在现有医疗跨模态数据集中占比不足5%，缺乏大规模、标准化的专属训练数据。

Ultrasound-CLIP框架的创新点有哪些？

框架创新融入UDAF引导的异质图编码器和基于UDAF的语义软标签，突破了通用模型的局限。

US-365K数据集的构建过程是怎样的？

团队从5个国际权威医疗数据库收集超声数据，经过多步骤处理和医疗专家审核，最终构建出US-365K数据集。

Ultrasound-CLIP在超声图像-文本检索任务中的表现如何？

在图像到文本检索任务中，Ultrasound-CLIP的准确率达37.45%，文本到图像检索达80.22%，实现高效双向匹配。

🏷️

继续阅读

中班运动会
2023年10月，二宫保育园中班在中央小学校举行运动会。小朋友们参与了体操和赛跑等项目，家长也积极参与。坡坡被选为示范代表，展示亲子体操。期待5月底的二年级运动会。
摘：《花间集》
本文通过多首古诗词表达了对春天、爱情和思乡的深情感受，描绘了自然景色与人情交融，展现了女性的柔美与思念，反映了诗人对生活的细腻观察与感悟。
Claude复活30年前传奇游戏，仅用一个周末
游戏开发者Jon Radoff利用Claude AI复活了他30年前开发的MUD游戏《未来往昔传奇》。在没有源代码的情况下，Claude成功重建了游戏世界...
Toots 414 2026 Apr.5 - Apr.11
意大利在Ferragosto假期期间，大型工厂和企业会关闭。2025至2026年冬季气温偏高，导致南方地区蚊虫数量激增。AI技术的发展将推动家电和电子产品的创新。
逻辑悖论真相揭秘：伪命题假警报，推理系统从未崩溃
逻辑悖论并非逻辑系统崩溃，而是由于不合格句子被错误输入。逻辑系统只处理能明确判断真假的命题，许多常见表达不符合这一标准。经典悖论如“我在说谎”实际上不是合...
那个集记账、基金、股票于一体的APP，又往前迈了一大步
这款APP集记账、基金和股票管理于一体，新增债务管理、私募基金及美股、港股功能，提升用户体验和稳定性。iOS版本即将上架，会员定价调整为39.9元，用户可...