苏黎世联邦理工学院与卡内基梅隆大学提出了一种新型数据驱动的多视角3D点追踪方法,能够在动态场景中通过少量相机实现鲁棒且精确的在线追踪,有效应对遮挡和复杂运动问题。
MPS 2025.1版本引入了新的代码生成目标语言,提升了项目视图性能,支持无生成器创建语言,增强了事务属性单元格功能,并提供了简单的测试语言示例。
本文探讨了大型语言模型在解谜方面的能力,指出其在复杂推理任务中的潜力和挑战。通过批判性评估,发现大型语言模型在高级逻辑推理方面与人类存在差距。文章强调了提升大型语言模型在解谜方面的需求,并提供了新的策略和数据集以促进人工智能的逻辑推理和问题解决。
本文提出了一种细粒度、基于实体级别的方法来量化语言模型的记忆能力,并提供了一种高效提取敏感实体的方法。实验结果显示语言模型在实体级别上具有较强的记忆能力,并能够在部分泄露情况下重新生成训练数据。这些发现要求语言模型的训练者在模型记忆方面更加谨慎,采用记忆减轻技术以防止隐私侵犯。
在野外安全自主性的先决条件是进行安全的测试。我们提出了一个基于互联网的安全自主智能体测试框架,通过上下文敏感的监视器对智能体的行为进行审计,强制实施严格的安全边界来阻止不安全的测试,并将可疑行为进行排名和记录以供人工审查。我们设计了一个灵活的基础安全监视器来监控现有 LLM 智能体,并使用对抗性模拟智能体来测试其识别和停止不安全情况的能力。然后,我们将安全监视器应用于 AutoGPT...
本研究使用真实Reddit个人资料构建数据集,证明了预训练语言模型(LLM)能够推断出个人隐私信息,包括地点、收入和性别等。研究还探讨了通过聊天机器人提取个人信息的新威胁,并证明了文本匿名化和模型对齐等缓解措施对保护用户隐私无效。
本研究测试了几种大型语言模型(LLMs)在解决认知科学文献中的演绎推理问题方面的能力。结果表明,LLMs在传统形式上解决这些问题的能力有限,且具有推理偏见。
完成下面两步后,将自动完成登录并继续当前操作。