小红花·文摘

本文研究医学影像AI在临床中的表现，指出忽视性能变异性的问题。通过估算未报告的标准差，提供准确的置信区间。研究发现，超过60%的论文中，第二名方法的平均性能在第一名的置信区间内，说明现有研究不足以支持模型的临床应用。