评估人工智能中预测可靠性以建立信任 —— 以多发性硬化为案例研究
原文中文,约300字,阅读约需1分钟。发表于: 。应用人工智能(AI)和机器学习(ML)在关键领域,如医学,需要实施安全措施,以降低预测错误带来的风险。本研究提出了一种评估 ML 预测可靠性的方法,该方法旨在通过检测 ML 失败来提供对临床决策的决策支持,并开发了一个名为 relAI 的 Python 包来嵌入可靠性度量到 ML 流程中。
介绍了NeuralSentinel(NS)工具,用于验证人工智能模型的可靠性和可信度,帮助非专业人员增强对系统的信心。工具在黑客马拉松活动中评估皮肤癌检测器的可靠性,并学习导致模型错误分类的因素和技术。工具还检测自身局限性并收集反馈以改进。