自主通才科学家(AGS)结合AI与机器人技术,能够独立完成科学研究的各个环节,提升科学发现的速度与广度。其系统超越人类能力限制,能在极端环境中进行实验,整合多学科知识,形成“知识飞轮”效应。未来,AGS将成为真正的通用科学家,推动科学研究的变革。
技术奇点是指人工智能超越人类智能的时刻,可能导致文明重大变化。测试超智能AI面临定义、不可预测性和自我改进等挑战。研究者提出能力基准、自我改进监测、目标一致性测试和模拟分析等方法。确保安全和价值对齐是应对伦理和生存风险的关键。
该文章介绍了一种机器-人类管道,通过使用基于LLM的代理体系结构和将对话与人物和时间事件图进行关联,生成高质量的非常长期的对话。作者通过人类注释者对对话进行检验和编辑,以确保其长程一致性和对事件图的关联。实验结果表明,LLM在理解冗长对话和理解对话中的长程时间和因果动态方面存在挑战。使用长上下文LLM或RAG等策略可以提供改进,但这些模型仍然远远落后于人类的性能。
选择性状态空间模型(SSMs)如Mamba克服了Transformer的一些缺点,但在复制和上下文学习能力任务上落后。然而,Mamba-2-Hybrid在12个标准任务上超过了Transformer,并且在生成推理标记时速度最多快8倍。混合模型在额外的长期上下文任务中继续匹配或超越了Transformer。
该文章提出了一种基于最优输运的测度,利用仅在测试时可用的信息来估计机器学习模型在未知领域的性能。经过经验评估,证明了该测度在选择源数据和架构以获得最佳未知领域数据性能以及在测试时预测已部署模型在未知领域的性能方面的效用。与流行的预测熵测度相比,该测度在相关性方面表现更好。
该研究通过利用类的语义信息,提出了一种简单的策略,扩展了领域泛化方法,使模型能够在未知领域和新类之间推广。在多个数据集上进行评估,为零射领域泛化研究奠定了基础。
本文介绍了一种利用三维全卷积网络的学习机制,用于预测三维点的检测分数和描述特征,并通过自监督的检测器损失指导特征匹配结果。该方法在多个数据集上取得了最先进的结果,展现了强大的概括能力,为实现准确快速的点云对齐提供了可靠的特征检测器。
通过研究发现,使用本地点特征的Transformer主干比3D CNN在3D目标检测中更加鲁棒。在地理位置适应中,关键是在测试时进行的锚点大小调整。源域数据增强允许模型推广到低分辨率传感器。用干净的天气数据直接训练比用恶劣天气数据训练更能提高对恶劣天气的鲁棒性。该研究为开发更加鲁棒的3D目标检测方法提供实际指导。
META-MT是一种基于元学习的方法,用于适应神经机器翻译系统(NMT)。通过在模拟的离线元训练领域适应任务的基础上学习如何适应新的未见过的领域,META-MT可以在很少的领域样例可用时显著优于经典的领域适应。
Delocate是一种新型深度伪造检测模型,能够识别和定位未知领域的深度伪造视频。通过恢复和定位两个阶段的方法,对于面部伪造区域的定位表现出较好的效果,并在跨领域检测性能上有所提升。
该文介绍了一种名为“零射领域泛化”的新领域泛化方法,该方法可以在未知领域的标签空间发生变化的情况下,将模型推广到新的未见领域和新类别。作者提出了一种简单的策略,有效地利用了类的语义信息,使现有的领域泛化方法满足零射领域泛化的要求。作者在多个数据集上评估了该方法,为这个新的研究方向奠定了坚实的基础。
本文提出了一种面部演示攻击检测(PAD)方法,通过逆向干预和面向类别的MixStyle来解决未知领域上的性能降级问题。该方法在有效性和效率上优于最先进的PAD方法。
完成下面两步后,将自动完成登录并继续当前操作。