苏黎世联邦理工学院与卡内基梅隆大学提出了一种新型数据驱动的多视角3D点追踪方法,能够在动态场景中通过少量相机实现鲁棒且精确的在线追踪,有效应对遮挡和复杂运动问题。
MPS 2025.1版本引入了新的代码生成目标语言,提升了项目视图性能,支持无生成器创建语言,增强了事务属性单元格功能,并提供了简单的测试语言示例。
本文探讨了大型语言模型(LLMs)在逻辑推理和解谜任务中的能力,指出它们在复杂推理方面与人类存在显著差距,尤其在多步骤推理和非单调逻辑上表现不佳,强调需要新的策略和数据集来提升推理能力。
这篇论文探讨了大型语言模型在记忆训练数据方面的能力及其隐私和公平性问题。研究发现,模型在表格预测任务中继承社会偏见,并提出通过标签反转等方法减轻偏见。同时,提出了量化模型记忆能力的方法,强调训练者需谨慎处理隐私风险。
在野外安全自主性的先决条件是进行安全的测试。我们提出了一个基于互联网的安全自主智能体测试框架,通过上下文敏感的监视器对智能体的行为进行审计,强制实施严格的安全边界来阻止不安全的测试,并将可疑行为进行排名和记录以供人工审查。我们设计了一个灵活的基础安全监视器来监控现有 LLM 智能体,并使用对抗性模拟智能体来测试其识别和停止不安全情况的能力。然后,我们将安全监视器应用于 AutoGPT...
本研究使用真实Reddit个人资料构建数据集,证明了预训练语言模型(LLM)能够推断出个人隐私信息,包括地点、收入和性别等。研究还探讨了通过聊天机器人提取个人信息的新威胁,并证明了文本匿名化和模型对齐等缓解措施对保护用户隐私无效。
本研究测试了几种大型语言模型(LLMs)在解决认知科学文献中的演绎推理问题方面的能力。结果表明,LLMs在传统形式上解决这些问题的能力有限,且具有推理偏见。
完成下面两步后,将自动完成登录并继续当前操作。