本研究针对UMAP方法在高维数据降维中的吸引力和排斥力问题进行分析,以揭示其对聚类形成和可视化的影响。论文提出了一种通过调整吸引力以改善聚类一致性的新方法,显著提高了UMAP及类似嵌入方法的可解释性、鲁棒性和准确性。
该研究提出了DiRe-JAX工具,旨在解决传统降维方法(如UMAP和tSNE)在全球结构丢失和计算效率方面的挑战。该工具高效、可扩展且可解释,适用于机器学习和生物信息学等领域。
本研究提出了一种新方法,通过谱数据压缩加速UMAP,解决了其在大规模数据集上的效率问题。该方法在减少数据集大小的同时保持流形结构,实验结果表明嵌入质量未受影响。
机器学习算法的成功依赖于数据质量和标签准确性。统一流形近似和投影(UMAP)算法可以发现异常值。UMAP应用于ChestX-ray14、CheXpert和MURA数据集中的异常值检测。该方法适用于任何类型的数据。
IsUMap是一种新型流形学习技术,集成了UMAP、Isomap和Vietoris-Rips过滤技术,能更准确地捕捉复杂的数据结构,解决了现有方法中的限制,并在实验证实中展示了表征质量的显著改善。
本文提出了三种类型的镜头函数,用于将高维数据投影到二维空间并显示隐藏模式。通过使用镜头函数,分析人员可以调整投影,揭示不可见的模式,并探索特征与数据结构之间的相互作用。在两个使用案例中展示了镜头函数的有效性,并分析了它们的计算成本。
在脑机接口领域,我们引入了一种名为近似 UMAP(aUMAP)的新方法,用于实时推断,其结果显示该方法能够在减少投影速度一个数量级的同时维持与标准 UMAP 相同的训练时间和投影空间。
本研究探讨了医学分割中熵和代表性采样技术的混合模型,使用UMAP技术捕捉代表性。熵-UMAP采样技术在Dice分数上优于随机基线,并在10种不同主动学习方法中获得最高的Dice系数。初步证据表明,在混合主动学习模型中,熵和UMAP方法之间存在协同作用。
完成下面两步后,将自动完成登录并继续当前操作。