该研究评估了大型语言模型在条件问答领域的能力和局限性。研究发现,微调的模型在某些情况下优于现有技术,但在抽取性问答方面落后于10个以上的点。研究强调了有效证据检索的重要性,并提出了改进训练任务和探索基于提示的技术以提高模型性能的未来工作的需求。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: