本文研究了抽象论证中的排名方法,提出了一种基于接受可行性的扩展排名语义框架,通过推广Dung的扩展语义,引入新的预序关系,为论证推理提供理论基础。
研究探讨了大型语言模型(LLMs)在社会学实验中的辩论能力及其局限性。结果显示,LLMs在模拟人类互动时存在偏见,影响其表现。通过辩论方法,非专家模型的准确率提高至76%。LLMs在虚假信息检测和论证推理方面表现良好,但仍需克服语言不一致等挑战,以增强其作为可靠工具的能力。
完成下面两步后,将自动完成登录并继续当前操作。