极道 ·

大模型不适用于临床管理：对真实世界电子健康记录中结构化查询的评估

💡 原文中文，约1000字，阅读约需3分钟。

📝

内容提要

西奈山的研究表明，人工智能在医院管理任务中表现不佳，尤其是在处理电子健康记录时。尽管AI能够理解问题，但由于未使用工具计算，导致错误。赋予模型编写代码的能力后，准确率显著提高。研究强调，AI应与传统工具结合使用，以优化医疗系统的性能。

🎯

🔎

西奈山的研究揭示了人工智能在医院管理中的不足，尤其是在处理电子健康记录时。尽管AI能够理解问题，但缺乏工具支持导致其计算错误。这提醒医疗机构在部署AI时，需谨慎评估其适用性，避免盲目依赖技术。

研究表明，最佳的AI模型应嵌入到混合工作流程中，结合传统工具与AI的优势。AI负责推理和意图识别，而传统工具则执行计算。这种方法不仅提高了准确性，也优化了医疗系统的整体性能，值得医疗管理者关注。

在选择AI模型时，医疗系统需考虑模型的架构和能力。研究指出，单一优化某一方面的系统性能不如同时优化多个方面的系统。因此，医疗机构在实施AI时，应综合考虑模型的多样性与应用场景，以实现最佳效果。

❓

人工智能在医院管理任务中表现不佳，尤其是在处理电子健康记录时，准确率低。

人工智能出错的原因是它试图自己计算，而不是使用工具进行计算，导致计数错误。

赋予模型编写和执行代码的能力后，准确率几乎达到了完美。

研究中测试了九个模型，针对5万例真实的急诊就诊记录进行了32950次查询。

医疗系统应将人工智能与传统工具结合使用，人工智能负责解释和推理，传统工具负责计算和执行。

表现最佳的模型通常嵌入到混合工作流程中，结合人工智能和传统工具的优势。

🏷️