CauseJudger：利用大语言模型识别推论逻辑中的因果关系

本研究解决了在反向思维模式下确定推论逻辑因果关系真实性的问题，提出了新框架CauseJudger（CJ），通过从反向转为正向思考并去除无关信息来提高因果识别的准确性。实验表明，CJ显著提升了因果判断的准确率，使用gpt-3.5最大提升达41%，且在使用gpt-4时，所有数据集的准确率超过90%。

LogicAsker是一种自动方法，用于评估和改进基于命题和谓词逻辑的大型语言模型的逻辑推理能力。通过在多个大型语言模型上进行测试，发现LogicAsker的测试用例可以有效提高逻辑推理能力，如GPT-4提高了10%。这是首次基于测试结果创建提示来提高语言模型的形式推理能力。

LogicAsker 大型语言模型大语言模型测试用例自动方法逻辑推理能力