小红花·文摘

本文提出了JuDGE基准，旨在评估中国法律系统中判决文书生成的能力。通过构建全面的数据集和真实案例进行自动化评估，以提升文书生成质量。实验结果表明，尽管现有RAG方法有所改进，但仍需进一步优化。

BriefGPT - AI 论文速递 ·

本文探讨了利用大型语言模型生成和解释线性时态逻辑（LTL）公式的方法，旨在减少对人工数据的依赖，提高自然语言命令的翻译准确率。研究提出了多种算法和框架，增强了模型在伦理推理和法律系统中的应用，提升了解释质量和可访问性。

BriefGPT - AI 论文速递 ·