本研究提出高斯图网络(GGN),有效解决了多视图图像中高斯表示的效率和泛化性问题。实验结果表明,该模型在使用更少高斯的情况下,图像质量和渲染速度优于现有技术。
智元推出了通用具身基座模型Genie Operator-1,基于Vision-Language-Latent-Action (ViLLA)架构,结合多模态大模型与混合专家,利用海量数据提升机器人操作能力,支持复杂任务,展现出优越的泛化性和灵活性。
本文探讨了机器学习中的虚假性,指出研究主要集中在统计虚假性,忽视了模型的实际理解。提出了关联性、泛化性、人类相似性和有害性等框架,强调识别相关性对模型性能和公正性的重要性。
本研究提出将大型语言模型(LLMs)与进化算法(EAs)结合,以提高自动化优化效率,解决手动干预过多和泛化性差的问题,并分析关键组件以促进两者的融合发展。
本研究提出了一种增强型自我监督表示学习方法,通过预训练解决了对比学习和重构学习中的问题,并提供上下文信息。实验证明该方法在多个下游任务上优于全监督学习模型和最先进的自我监督学习方法,具有高泛化性和可迁移性。
本研究使用基于梯度的元学习方法解决了室内机器人深度估计在未知数据集上的泛化性不足问题。该方法提高了模型的泛化能力,并在有限数据上显示出显著的优越性。该方法为深度估计模型提供了简单有效的插件,推动了深度学习与元学习的结合,助力实际机器人和机器感知的应用。
本研究介绍了Open-VCLIP++,通过修改CLIP来捕捉视频时空关系,创建视频分类器,追求泛化性。利用权重插值的优势,训练Open-VCLIP++等同于零历史数据的持续学习。在动作识别数据集上评估,超过现有技术水平。在UCF、HMDB和Kinetics-600数据集上分别实现了88.1%、58.7%和81.2%的零样本准确率,比最佳替代方法高出8.5%、8.2%和12.3%。在MSR-VTT视频文本检索数据集上达到竞争水平,使用更少的微调数据。
本文介绍了一种自动检测对称性水平的方法,并通过学习对称性的分布生成伪标签,从而在无监督学习中学习每个输入的对称性水平。该方法在合成数据集上验证了其在生成无对称性数据集和检测推理期间的非同分布对称性方面的实际应用。该方法能提高非等变模型的泛化性和鲁棒性。
本文介绍了等效交互可解释性理论体系,解释了神经网络训练过程中的泛化性和内在机理。作者提出了三个角度来解释神经网络的内在机理,并讨论了训练过程中的两阶段现象和交互变化的动态过程。作者团队在该领域做出了重要研究并发表了多篇论文。
在2024国际基础科学大会“基础科学与人工智能论坛”上,AI专家讨论了人工智能的发展方向,包括大模型的抽象能力、主观价值和情感知识,商业应用的超级产品,模型泛化性和互动性的思考,智能体的能力边界,模型的幻觉问题和落地挑战。
MetaUrban是一个针对城市空间的具身人工智能研究平台,通过构建互动城市场景,提高移动机器人的泛化性和安全性。该平台将促进城市空间中安全可信赖的具身人工智能的研究。
本文提出了一种针对图分类的算法,通过吸收不同类型任务的观点,增强图分类的适应性、可扩展性和泛化性。实验结果显示该方法显著提升了性能。
AI系统通过思维链在语言模态上实现多步推理进展。研究提出两个关键见解,并通过DDCoT在多模态推理中保持临界态度。DDCoT生成的解释提升了语言模型的推理能力,展示了泛化性和可解释性。
研究人员重新审视了十年前的“数据集分类”实验,发现现代神经网络在分类图像来自哪个数据集的问题上能够达到极高的准确率。进一步实验表明,这样的数据集分类器可以学习到具有泛化性和可转移性的语义特征,有助于重新思考数据集偏差和模型能力的问题。
本文介绍了一种新的人-场景交互生成方法,通过利用大规模配对的数据集MOB,训练单个运动控制器来处理各种场景中的人-场景交互动作。该方法在一般场景中具有良好的泛化性。
人的推理可以理解为直觉、联想的 “系统 1” 和理性、逻辑的 “系统 2” 之间的协作。研究人员提出了一个新的符号系统,利用大型语言模型的进展作为符号的近似,以提高解释性、泛化性和数据效率。通过模糊逻辑计算的规则推理出活动的语义。该方法在广泛的活动理解任务中显示了优越性。
本研究通过随机化奖励函数训练多样化的社交车辆驾驶策略,并提出增强自车驾驶策略鲁棒性的训练策略。该方法成功学习到了在挑战性的交叉口情景中对具有分布之外行为的社交车辆具有泛化性的自车驾驶策略。
通过自适应学习和连接不同区域的曝光表示,我们提出了一种面向区域的曝光校正网络(RECNet),可处理混合曝光的图像。实验证明了该方法的优越性和泛化性。
本文研究了在有噪声标签的情况下,过度参数化的深度神经网络的正则化方法。实验结果表明,通过参数与初始化之间的距离和为每个训练示例添加一个可训练的辅助变量,可以有效提高模型的泛化性。泛化误差的上界独立于网络的大小,可达到无噪声标签情况下的水平。
完成下面两步后,将自动完成登录并继续当前操作。