小红花·文摘 - 小红花技术领袖俱乐部

RVPO：通过方差正则化实现风险敏感的对齐

RVPO：通过方差正则化实现风险敏感的对齐

Apple Machine Learning Research ·

本研究提出了一种基于电子健康记录的经验检索增强框架（ExpRAG），旨在提高大型语言模型在临床应用中的可靠性。实验结果显示，ExpRAG在医疗推理中比传统方法提高了5.2%的准确性，强调了案例知识在医疗决策中的重要性。

Experience Retrieval-Augmentation Technology Based on Electronic Health Records Enables Accurate Discharge Quality Assessment

BriefGPT - AI 论文速递 ·

最新研究推出了MedR-Bench评估基准，涵盖1,453个病例，评估医疗推理大语言模型的表现。结果显示，模型在简单诊断任务上的准确率超过85%，但在复杂任务中仍存在不足，推理过程的完整性和逻辑性亟待提升。开源模型DeepSeek-R1展现出追赶闭源模型的潜力，推动医疗AI的发展。

LLM医疗推理能力深入剖析：你可以相信DeepSeek医生么？

HyperAI超神经 ·

最懂医疗的国产推理大模型，果然来自百川智能

最懂医疗的国产推理大模型，果然来自百川智能

机器之心 ·