本文讨论了卷积神经网络(CNN)的设计,包括特征提取器和分类器的结构。特征提取器由卷积层和池化层构成,分类器通过全连接层进行预测。使用奇数尺寸的卷积核有助于保持对齐并简化填充。随着网络深度增加,性能提升逐渐减缓,现代设计倾向于使用全局平均池化以降低过拟合风险。整体设计仍依赖经验和直觉,缺乏坚实的理论基础。
本研究提出了一种名为EAPCR的通用特征提取器,旨在解决深度学习在处理多源异构数据时缺乏明确特征关系的问题。EAPCR在多个科学任务中表现出色,超越传统方法,展现出强大的鲁棒性和适应能力,为科学数据分析提供了新解决方案。
本研究利用机器学习技术分析胎盘组织学图像,深入探讨母体炎症反应(MIR)。结果显示,注意力多实例学习模型的分类准确率达到88.5%,且病理基础模型的性能优于ImageNet特征提取器,为MIR的早期识别提供了新思路。
本文介绍了一种新颖的LM-RRG方法,结合大型模型和临床质量强化学习,生成准确全面的胸部X射线报告。该方法通过特征提取器分析和解释X射线图像的不同区域,强调医学意义,并利用多模态提示生成放射学报告。实验结果证明了该方法的优越性。
本研究通过修改特征提取器和编码器-解码器堆栈,探索了LaneSegNet架构的优化方法,提高了计算机视觉算法对道路特征的准确评估能力。研究结果为资源有限的用户提供了更可行的解决方案,并增强了资源丰富的用户的能力。
本文介绍了一种高效的无监督域自适应框架,使用DINOv2作为特征提取器,并使用简化的完全连接层对特征进行改进,以实现增强的域适应。实验结果表明,该方法在性能上与其他最先进的域自适应方法相当,并且可训练参数减少了42%至99.7%。
研究发现传统联邦学习方法在面对数据异质性时表现欠佳。FedAvg中的特征提取器优于大多数个性化联邦学习方法的特征提取器。通过线性变换对特征进行对齐,FedAvg可以超越大部分PFL方法。为解决不匹配问题并增强特征提取器质量,提出了一种名为FedPFT的新型PFL框架。实验证明,FedPFT的性能超过了最先进的方法,提高了7.08%。
该研究提出了一种级联范式,用于在测试时间内将源预训练模型适应一系列未标记目标领域的问题。该方法通过更新特征提取器和分类器来减轻它们之间的不匹配,并在有限未标记数据的情况下鼓励快速适应。实验证明该方法在图像分类、文本分类和语音识别等任务中具有优越性。
本文提出了一种用于在线连续学习问题的简单算法,该算法采用kNN分类器和通用预先训练的特征提取器,可以在小的计算预算下紧凑存储和利用整个数据流,既能减少过往数据的灾难性遗忘,同时也能快速适应快速变化的数据流。在Continual LOCalization (CLOC)和Continual Google Landmarks V2 (CGLM)两个大规模OCL数据集上取得了最新的技术水平。
本文提出了一种用于在线连续学习问题的简单算法,该算法采用kNN分类器和通用预先训练的特征提取器,可以在小的计算预算下紧凑存储和利用整个数据流,同时减少过往数据的灾难性遗忘,快速适应快速变化的数据流。在Continual LOCalization (CLOC)和Continual Google Landmarks V2 (CGLM)两个大规模OCL数据集上取得了最新的技术水平。
本文比较了医学图像中计算Fréchet距离(FD)的特征提取器,发现SwAV与医学专家判断相关。建议谨慎使用经过医学图像训练的提取器,并使用SwAV训练提取器评估合成医学图像。
DeeSIL是一种增量学习算法,使用深度表示的特征提取器和独立的浅层分类器来增加识别容量。在ImageNet LSVRC 2012数据集上表现更好。
我们提出了一种基于INS的轻量级深度学习方法ELESON,用于行人分类。通过特征提取器,ELESON解耦行人状态和人体动作,并利用证据状态分类器估计行人状态的置信度。在实验中,ELESON在F1分数上具有15%的分类改进,在AUROC上具有10%的置信度鉴别力提高,并且在智能手机上具有低计算和内存要求。
通过使用预训练的文本到图像扩散模型生成未来类别的合成图像并使用它们训练特征提取器,我们提出的方法改进了无典范类增量学习的最新方法,特别是在只包含少量类别的最困难的情况下。此外,我们还表明使用未来类别的合成样本比使用不同类别的真实数据能够实现更高的性能,为增量学习的更好和更低成本的预训练方法铺平了道路。
本文通过实证研究代表性生成模型 GAN,分析了特征空间中代表数据点、计算合理距离以及每组使用多少个实例等问题。实验结果表明,基于CNN和ViT的架构是可靠的特征提取器,CKA能够产生更好的比较,补充了现有指标。这些发现帮助设计了一个新的测量系统,重新评估了最先进的生成模型。
通过熵分析发现,少量点云可恢复物体的三维形状。提出了Few-point Shape Completion (FSC)模型,包含双分支特征提取器和显著性分支,修正网络增强特征和输出的细节和真实性。实验证明FSC模型在少量点输入和多量点输入上胜过先前方法,并对不同物体类别具有良好泛化性。
本文介绍了一种新颖的LM-RRG方法,结合大型模型和临床质量强化学习,生成准确全面的胸部X射线报告。该方法通过特征提取器分析和解释不同区域的X射线图像,强调医学意义的特定区域,并利用多模态提示生成放射学报告。实验结果证明了该方法的优越性。
本文介绍了一种新颖的LM-RRG方法,结合大型模型和临床质量强化学习,生成准确全面的胸部X射线放射学报告。该方法通过特征提取器分析和解释胸部X射线图像的不同区域,强调医学意义的特定区域,并利用多模态提示生成放射学报告。实验结果证明了该方法的优越性。
该研究提出了基于深度学习的解决方案,用于监控视频中的投掷行为检测,并通过生成新的公开数据集和比较不同特征提取器的性能来改善异常检测算法,实验结果良好。
本文研究了通过在计算机视觉系统中使用记忆来改进视频流中的物体检测的精度和减少计算时间的问题。通过交替使用传统的特征提取器和轻量级的提取器,展示了在存在时间记忆的情况下,进行准确检测所需的计算量很小。同时,展示了记忆可以应用于强化学习算法来学习自适应推断策略。该模型在 Imaget VID 2015 数据集上实现了最先进的性能,并在 Pixel 3 手机上以 70+ FPS 的速度运行。
完成下面两步后,将自动完成登录并继续当前操作。