本研究探讨了模糊量词在视觉上下文中的有效性,填补了现有研究的空白。通过VAQUUM数据集,发现视觉语言模型在使用模糊量词时受对象数量的影响,各模型表现不一致,表明判断和生成依赖于不同的过程。
本文探讨了机器学习在符号计算和约束优化中的应用,特别是支持向量机在变量排序和问题实例识别中的优势。研究表明,机器学习超越了传统启发式算法,有效提高了求解效率和准确性。结合深度学习和可解释AI技术,机器学习为符号计算提供了新的视角,推动了该领域的发展。
本文探讨大型语言模型(LLMs)在逻辑推理中的表现,提出FRODO框架以提高推理步骤的可靠性。研究表明,FRODO在鲁棒性和泛化能力上优于其他方法,并通过新数据集LFUD评估LLMs的逻辑谬误理解能力。实验结果显示,LLMs在复杂推理任务中仍存在困难,需进一步改进。
该文章介绍了使用Isabelle/HOL中的浅层语义嵌入实现规范条件推理的结果,重点是Aqvist的E系统及其扩展。作者提供了一个人口伦理学中的悖论的计算机编码,并探讨了该编码是否增加或减少了令人讨厌的结论的吸引力和说服力。
该文介绍了一种形式化自然语言中量词的方法,适用于人机交互背景。通过设计了一个端到端系统,能够接收自然语言输入,将其转换为形式逻辑表示,并进行评估。该系统可以返回结果或向模拟机器人发送命令来演示该方法。
完成下面两步后,将自动完成登录并继续当前操作。