大型语言模型在网络威胁情报中的不可靠性

📝

内容提要

本研究针对大型语言模型在网络威胁情报(CTI)任务中的可靠性问题进行了评估,提出了一种评估方法,以测试其在零样本学习、少样本学习和微调中的表现。研究发现,尽管少样本学习和微调仅能部分改善结果,但大型语言模型在面对真实报告时表现不足且不一致,表明其在CTI情境中的应用存在潜在安全风险。

🏷️

标签

➡️

继续阅读