本研究提出了一种改进的对称非负矩阵分解方法,通过引入可学习权重的加权$k$-NN图和双重结构的不相似性矩阵,显著提升了相似性矩阵的区分能力。实验结果表明,该模型在八个数据集上优于九种先进聚类方法,展现出良好的应用潜力。
本研究探讨生成模型中的数据剪枝问题,提出通过简单聚类方法识别并保留对训练最有益的核心子集,以提升模型性能并平衡数据分布中的代表性不足人群。
本研究探讨了多目标强化学习中的目标权衡问题,提出了一种基于聚类的方法,揭示了政策行为与目标值之间的关系。结果表明,该方法在四个多目标环境中优于传统的k-中点聚类,具有实际应用潜力。
本研究提出了一种通用性度量框架,用于从事件日志中发现模式并与流程模型进行比较。通过神经网络和聚类方法,解决了点击数据分析的障碍,验证了流程挖掘对事件日志的影响。同时,研究了不确定性事件数据的应用,提出了基于上下文的异常检测方法,以提高流程洞察力。
本文探讨了结构化变分自编码器和预训练语言模型(PLMs)在无监督学习中的潜力,强调了语境化嵌入在句子编码中的作用。研究表明,结合对比学习和聚类方法能够显著提升概念嵌入的语义表示和主题发现效果,尤其在处理复杂语言特征时表现优越。
该研究提出了一种工业联邦学习系统,旨在优化边缘设备的协作与知识转移。通过新方法CPFL,减少了训练时间和资源使用,同时保持模型准确性。研究还探讨了聚类方法HCFL及其增强版本HCFL+,并提出自适应聚合权重算法,强调客户选择的重要性。FedClust方法在非独立同分布数据上显著提高了模型精度和收敛速度。
本文介绍了针对不完整多视图数据聚类的新方法,包括ICMVC、OMVC和CDIMC-net。这些方法通过优化特征表示、动态权重和对比学习等技术,解决了缺失值和数据不一致性问题,实验结果表明其聚类效果优于现有方法。
FedClust 是一种聚类联邦学习方法,通过分析局部模型权重与客户数据分布的相关性进行客户分组,能够动态适应新客户。实验结果表明,FedClust 在准确性和通信成本方面优于基线方法。同时,FedAC 框架通过解耦神经网络和不同聚合方法,提高了在非独立同分布环境下的测试准确率。此外,研究还提出了多种新型聚类方法,以解决联邦学习中的数据隐私和性能问题。
本文介绍了多种基于去噪扩散概率模型的生成和聚类方法,如TreeVAE、VaDE和ClavaDDPM。这些模型通过优化潜在表示和引入层次结构,显著提升了聚类和生成性能,尤其在生物医学图像和分子设计领域表现突出。
本文提出了一种基于句子级检索的kNN-MT框架,旨在提高机器翻译的解码和存储效率。该框架通过对比学习和聚类方法显著提升了检索效率,并在多个数据集上表现出色,支持领域自适应。同时,研究探讨了结合元k网络和自动编码器的方法,以增强翻译的准确性和可靠性。
本研究提出了一种基于Wasserstein梯度流的渐进流逼近方法,适用于机器学习中的非线性滤波。该方法无需领域离散化,展示了在高维数据集上的性能和可扩展性。同时,研究探讨了Wasserstein距离的梯度流理论及其在概率分布优化中的应用,提出了一种新的聚类方法,利用Wasserstein距离进行联合优化,展现了良好的灵活性和一致性。
本文介绍了多种图结构学习和聚类方法,包括SE-GSL框架、SpectralNet深度学习方法、结构深度聚类网络(SDCN)和结构熵半监督聚类(SSE)。这些方法通过优化图结构和聚类准确性,提高了鲁棒性和可解释性,特别是在生物数据分析和高维数据学习中表现优异。
本文介绍了一种解决点云理解问题的通用简单框架,通过聚类方法生成聚类,并结合特征相似性学习合并过度细分的聚类,以及引导标签传播。实验证明该框架在点云理解任务中表现最佳,具有潜力应用于机器人操作和自主导航。
本文介绍了一种基于DCHSBM的高可扩展性聚类方法,通过最大似然推断实现超图聚类,能恢复具有高阶结构的真实聚类。
本研究提出了一种名为“可传递视觉Transformer”的统一框架,融合了迁移学习、注意力机制和聚类方法,实现了无标签目标域的知识迁移。TVT方法优于微调和迁移学习方法,通过注入传递性适应模块来强制ViT集中注意力在可转移和辨别性特征上,并借助判别性聚类来增强特征多样性和分离度。
TAC是一种新的聚类方法,利用外部知识作为监督信号来引导聚类,同时采用文本和图像模态的相互作用,通过跨模态邻域信息相互影响来改进图像聚类性能。实验证明,TAC在五个广泛使用的和三个更具挑战性的图像聚类基准上取得了最先进的性能。
本研究提出了一种基于将图像转换为点云的图像生成过程,使用简单聚类方法和多层感知器作为生成模型,无需使用卷积或注意机制。通过集成模块生成额外的聚类点,实现了独特的CoC-GAN模型。实证评估表明,CoC-GAN模型展现出了优秀的性能和可解释性,为将上下文聚类应用于图像生成方法奠定了基础。
本文使用聚类方法和机器学习算法识别和分类信用风险模型中的问题。作者通过分析645个标题和观察结果,使用嵌入式生成和四个预训练模型,并使用聚类方法将相似特征的发现分组。结果证明聚类和机器学习可以有效分析验证报告中的文本信息,并提供信用风险模型开发和验证中的洞见。
本文讨论了高维数据的探索与分析,重点介绍了降维技术,如主成分分析(PCA)和UMAP。PCA通过线性变换减少数据维度,保持信息相关性;UMAP则通过构建图形表示,保留数据的拓扑结构。文章还提到聚类方法,以识别数据中的不同类别。选择合适的方法需结合具体问题和经验判断。
完成下面两步后,将自动完成登录并继续当前操作。