小红花·文摘

全球首个人形机器人通用小脑来了！全球最大规模2万小时人类动作数据，实现零样本泛化

量子位 ·

本研究提出高斯图网络（GGN），有效解决了多视图图像中高斯表示的效率和泛化性问题。实验结果表明，该模型在使用更少高斯的情况下，图像质量和渲染速度优于现有技术。

Gaussian Graph Networks: Learning Efficient and Generalizable Gaussian Representations from Multi-View Images

BriefGPT - AI 论文速递 ·

智元推出了通用具身基座模型Genie Operator-1，基于Vision-Language-Latent-Action (ViLLA)架构，结合多模态大模型与混合专家，利用海量数据提升机器人操作能力，支持复杂任务，展现出优越的泛化性和灵活性。

ViLLA——继AgiBot World之后，智元发布GO1及其背后基于潜在动作的VLA架构ViLLA：利用海量的无标注视频做训练(含LAPA、Moto的详解)

结构之法算法之道 ·

本文探讨了机器学习中的虚假性，指出研究多集中于统计虚假性的传统定义，忽视了模型的实际理解。提出了关联性、泛化性、人类相似性和有害性等多维度框架，强调识别相关性对提升模型性能和公正性的重要性。

A Multidimensional Exploration of Spuriousness in Machine Learning

BriefGPT - AI 论文速递 ·

本文探讨了归纳逻辑编程（ILP）在机器学习中的应用，提出了解决泛化性差和可解释性不足的新方法。研究介绍了ILP的基本概念、学习模式，以及在公平招聘和金融欺诈检测中的应用，强调了递归程序学习和规则提取算法的有效性。

可微分归纳逻辑编程在欺诈检测中的应用

BriefGPT - AI 论文速递 ·

本研究提出将大型语言模型（LLMs）与进化算法（EAs）结合，以提高自动化优化效率，解决手动干预过多和泛化性差的问题，并分析关键组件以促进两者的融合发展。

可解释性终极追问，什么才是第一性解释？20篇CCF-A+ICLR论文给你答案

机器之心 ·

在2024国际基础科学大会“基础科学与人工智能论坛”上，AI专家讨论了人工智能的发展方向，包括大模型的抽象能力、主观价值和情感知识，商业应用的超级产品，模型泛化性和互动性的思考，智能体的能力边界，模型的幻觉问题和落地挑战。

港大马毅：大模型长期没有理论就像盲人摸象；大佬齐聚谈AI下一步

量子位 ·

本文提出了一种基于图测地线距离（GGD）的光谱框架，用于评估图神经网络（GNNs）的泛化性和稳定性。GGD度量通过光谱图匹配和图粗化方案，有效量化图之间的差异，尤其在节点特征有限时表现出显著改进。实验结果表明，该方法在多种评估指标上优于现有模型。

基于学习到的广义测地线距离函数的图节点特征增强方法

BriefGPT - AI 论文速递 ·

通过自适应学习和连接不同区域的曝光表示，我们提出了一种面向区域的曝光校正网络（RECNet），可处理混合曝光的图像。实验证明了该方法的优越性和泛化性。

针对混合曝光校正的区域感知曝光一致性网络

BriefGPT - AI 论文速递 ·

本文研究了在有噪声标签的情况下，过度参数化的深度神经网络的正则化方法。实验结果表明，通过参数与初始化之间的距离和为每个训练示例添加一个可训练的辅助变量，可以有效提高模型的泛化性。泛化误差的上界独立于网络的大小，可达到无噪声标签情况下的水平。

一种用于改进泛化能力的正则化 1NN 分类器的新方法

BriefGPT - AI 论文速递 ·

AI系统通过思维链在语言模态上实现多步推理进展，提出了两个关键见解并通过DDCoT保持多模态推理的临界态度。DDCoT生成的解释改进了语言模型的推理能力，展示了泛化性和可解释性。

本研究介绍了Open-VCLIP++框架，通过修改CLIP捕捉视频时空关系，创建视频分类器，追求泛化性。利用权重插值的优势，训练Open-VCLIP++等同于零历史数据的持续学习。在动作识别数据集上评估，超过现有技术水平。在UCF、HMDB和Kinetics-600数据集上分别实现88.1%、58.7%和81.2%的零样本准确率，比最佳替代方法高出8.5%、8.2%和12.3%。在MSR-VTT视频文本检索数据集上达到竞争水平，使用更少的微调数据。