医疗多项选择题回答的正确性覆盖的统计保证
📝
内容提要
本研究解决了大语言模型在高风险医疗任务中存在生成不实信息的问题。通过首次将符合预测框架应用于医疗多项选择题回答,提出了一种新的方法,将非符合性评分与正确选项的频率评分相关联。研究结果表明,该框架能够有效控制错误率和覆盖率,为大型语言模型的可靠性提供了有力支持。
🏷️
标签
➡️