本研究评估了现代SMT求解器在约束满足问题中的应用,发现其在解决25x25数独难题时显著优于传统SAT求解器,展示了SMT求解器的有效性及逻辑求解器的演变。
该研究将对话一致性概念化为约束满足问题,并通过实验检测了LLM重新词汇化对话中的不一致性。结果表明,约束满足问题对于检测对话的不一致性非常有效,而优秀的LLMs在对话的一致性重新词汇化方面存在挑战。此外,源自领域知识的约束是最难被遵守的。研究认为,约束满足问题能够捕捉到对话一致性的核心特性。
本文研究了本体基础数据查询的不同类别,包括关系数据库查询与本体、描述逻辑或其他相关一阶逻辑和联结查询。研究结果包括三个方面,首先用不相交的 Datalog 片段来表达了本体中介查询的表达能力。其次,本体中介查询与约束满足问题(CSP)及其逻辑泛化 MMSNP 公式有密切联系。最后,利用这些联系得出了有关本体中介查询的新结果,如 i)本体中介查询的一阶重写和 Datalog 重写,ii)本体中介查询的 P / NP 二分法,以及 iii)本体中介查询的查询包容性问题。
该研究使用Transformer-based大型语言模型,研究了其生成错误文本时的内部行为,并将事实查询建模为约束满足问题。通过研究11个数据集,研究提出了一种可以预测约束满足和事实错误、并且可以早期发现错误的self-attention模式探查方法SAT Probe。利用对大型语言模型中事实性的机械理解可以提高可靠性。
完成下面两步后,将自动完成登录并继续当前操作。