语言智能体旨在通过自身经验学习超越人类,但目前依赖专家数据微调,导致扩展性和泛化能力不足。Meta提出“早期经验”范式,通过智能体自身行为生成交互数据,作为监督信号,促进强化学习与模仿学习的结合。
机器之心数据服务现已上线,提供高效稳定的数据获取服务,帮助用户轻松获取所需数据。
本文讨论了卷积神经网络(CNN)的设计,包括特征提取器和分类器的结构。特征提取器由卷积层和池化层构成,分类器通过全连接层进行预测。使用奇数尺寸的卷积核有助于保持对齐并简化填充。随着网络深度增加,性能提升逐渐减缓,现代设计倾向于使用全局平均池化以降低过拟合风险。整体设计仍依赖经验和直觉,缺乏坚实的理论基础。
卷积神经网络(CNN)专为图像数据处理而设计,显著提升计算机视觉能力。通过卷积层和池化层,CNN有效提取特征,克服传统神经网络在图像处理中的局限。其结构包括特征提取器和分类器,利用激活函数和数据增强技术提高模型的鲁棒性。
本研究针对卫星图像中目标定位面临的高变异性和低空间分辨率等挑战,提出了一种新的YOLO-DCAP模型,以提高复杂场景下的目标定位能力。该模型结合了多尺度扩张残差卷积和注意力辅助空间池化模块,显著提升了目标定位的准确性,并在多个卫星数据集上表现出优越的性能。
本研究提出了一种基于卷积神经网络的多类别脑肿瘤分类方法,通过图像预处理和超参数调优,构建轻量级深度学习模型,实现了98.78%的分类准确率,具有临床应用潜力。
本研究解决了小卫星技术中数据传输效率低和实时异常检测不足的问题。采用卷积自编码器实现数据压缩和源头异常检测,提升了小卫星在灾害监测中的应用性能。研究结果显示,机器学习方法可有效提升小卫星数据处理效率,并推动非洲空间技术与人工智能的发展。
本文介绍了上海交通大学与传音团队合作的DSCLoRA模型,该模型在CVPR NTIRE 2025高效超分辨率挑战赛中获第一名。DSCLoRA结合低秩适应和知识蒸馏技术,显著提升超分辨率性能,且未增加计算成本。通过引入ConvLoRA,DSCLoRA在多个基准数据集上表现优异,展示了模型复杂度与性能的良好平衡。
本研究解决了混合CNN-变换器模型在医学影像分类中可解释性不足的问题。我们提出了一种可设计可解释的混合全卷积CNN-变换器架构,能够生成直接反映模型决策过程的局部证据图,提升了模型的可解释性与性能。实验结果表明,该模型在医学图像分类任务中不仅预测性能达到最先进水平,还能在单次前向传播中提供类别特定的稀疏证据图。
本研究提出了一种新型多任务学习框架DG-STMTL,用于智能交通系统中的时空交通预测。该框架结合静态和动态邻接矩阵,通过特定门控机制提高预测精度,实验结果表明其优于现有方法,具有良好的效果与稳健性。
香港大学研究团队提出的新型视觉基础模型OverLoCK,结合了人类视觉的“纵观全局-聚焦细节”机制。在多个数据集上表现优异,特别是在ImageNet-1K上达到84.2%的准确率,超越现有卷积网络和Transformer,展现出强大的动态建模能力。
本研究提出了一种新颖的水下图像增强算法UIE-SNN,基于脉冲神经网络,能耗降低85%,同时保持图像清晰度,为海洋自主视觉导航提供技术支持。
本文提出了一种新颖的框架,将集成学习与增强图结构相结合,以提高图中半监督节点分类的性能和鲁棒性。该方法通过创建同一图的多个增强视图,利用“多样性人群的智慧”,有效缓解嘈杂图结构带来的挑战,并在多个真实世界数据集上的实验表明了其有效性。
本研究针对在传感器上实现卷积神经网络的现有解决方案缺乏优化的空白,首次提出了深度优先卷积神经网络在智能传感器处理单元上的优化设计。通过在传感器和微控制器之间进行卷积神经网络的分区,并采用早期退出机制,本研究显著降低了功耗,实现了与常规推理管道相同的准确率,但平均电流消耗减少了11%。
研究者提出了一种名为FlowMo的图像tokenization改进方案,通过两阶段训练提升图像重建质量。FlowMo在ImageNet-1K数据集上表现优异,采用基于Transformer的扩散自编码器,优化了图像压缩与重建过程。
本研究解决了传统特征融合方法忽视人脸识别中关键差异特征的问题。提出的MSConv模块通过多尺度混合卷积,同时提取明显特征和差异特征,提升了特征表示的有效性和模型的识别能力。实验结果表明,MSConv在综合这两类特征后,优于仅关注明显特征的模型。
卷积是数学运算符,用于描述一个函数如何被另一个函数修改,适用于线性时不变系统。通过烟雾和火柴的例子,可以理解卷积的概念。在图像处理中,卷积涉及矩阵运算,通常使用3x3的卷积核。
本研究解决了阿尔茨海默症(AD)诊断中关于脑淀粉样沉积的早期识别问题,提出了一种基于变换器的几何深度学习模型,结合了经过训练的高斯过程模型生成的解剖标志。该模型在AD分类任务中表现优异,并且能够有效预测中风险人群的脑淀粉样阳性,可能改善AD诊断的准确性,减少对昂贵和侵入性PET扫描的依赖。
本文解决了多智能体路径规划(MAPF)中的去中心化规划问题,提出了一种名为RAILGUN的中心化学习策略。通过采用基于卷积神经网络的架构,RAILGUN能够在不同的地图上进行有效的路径规划,显著超越了大多数基线方法,并在未见过的任务和地图上展示了卓越的零-shot泛化能力。
本研究解决了大型语言模型微调中存在的参数高效性不足的问题,尤其是在低秩适应方法的限制下。通过提出一种新的子空间反卷积微调方法(DCFT),研究者们展示了如何通过调整内核大小来动态控制参数,突破了秩一分解的局限性,并在大量实验中验证了该方法比传统LoRA更具参数效率,降低了8倍参数同时保持良好的性能。
完成下面两步后,将自动完成登录并继续当前操作。