大型语言模型在代码生成中取得进展,但生成代码有时不准确。研究提出代码幻觉概念,分为映射、命名、资源和逻辑四种类型。通过动态检测算法和CodeHalu基准测试集,评估16个模型的幻觉频率和性质。结果显示模型在准确性和可靠性上有差异,强调改进模型和训练方法的重要性。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: