Patronus AI开发了Lynx,一个先进的幻觉检测模型,能够识别LLM中的幻觉回答。Lynx在实验中表现优于现有评估器,特别在医疗问题回答中有7.5%的差异。Patronus AI开源了Lynx和HaluBench,推动RAG评估研究的进展。
完成下面两步后,将自动完成登录并继续当前操作。