小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
RVPO:通过方差正则化实现风险敏感的对齐

本文提出了一种风险敏感的奖励方差优化框架(RVPO),旨在解决多目标奖励聚合中的约束忽视问题。RVPO通过惩罚奖励间的方差,优化模型的一致性,从而在医疗和科学推理任务中提高表现。实验结果表明,RVPO在HealthBench上显著优于传统方法,并在保持准确性的同时,避免了多奖励方法的性能下降。

RVPO:通过方差正则化实现风险敏感的对齐

Apple Machine Learning Research
Apple Machine Learning Research · 2026-05-08T00:00:00Z

本研究提出了一种基于电子健康记录的经验检索增强框架(ExpRAG),旨在提高大型语言模型在临床应用中的可靠性。实验结果显示,ExpRAG在医疗推理中比传统方法提高了5.2%的准确性,强调了案例知识在医疗决策中的重要性。

Experience Retrieval-Augmentation Technology Based on Electronic Health Records Enables Accurate Discharge Quality Assessment

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-23T00:00:00Z

最新研究推出了MedR-Bench评估基准,涵盖1,453个病例,评估医疗推理大语言模型的表现。结果显示,模型在简单诊断任务上的准确率超过85%,但在复杂任务中仍存在不足,推理过程的完整性和逻辑性亟待提升。开源模型DeepSeek-R1展现出追赶闭源模型的潜力,推动医疗AI的发展。

LLM医疗推理能力深入剖析:你可以相信DeepSeek医生么?

HyperAI超神经
HyperAI超神经 · 2025-03-17T03:26:29Z
最懂医疗的国产推理大模型,果然来自百川智能

百川智能发布了全场景深度思考模型Baichuan-M1-preview,具备语言、视觉和搜索推理能力,特别在医疗领域表现突出,提升临床决策效率。此外,百川推出了开源的Baichuan-M1-14B,专注于医疗推理,推动AI医疗技术进步。

最懂医疗的国产推理大模型,果然来自百川智能

机器之心
机器之心 · 2025-01-24T07:33:21Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码