小红花·文摘

本研究针对UMAP方法在高维数据降维中的吸引力和排斥力问题进行分析，以揭示其对聚类形成和可视化的影响。论文提出了一种通过调整吸引力以改善聚类一致性的新方法，显著提高了UMAP及类似嵌入方法的可解释性、鲁棒性和准确性。

UMAP中的吸引力形状：探讨降维中的嵌入力

BriefGPT - AI 论文速递 ·

该研究提出了DiRe-JAX工具，旨在解决传统降维方法（如UMAP和tSNE）在全球结构丢失和计算效率方面的挑战。该工具高效、可扩展且可解释，适用于机器学习和生物信息学等领域。

DiRe-JAX: A JAX-Based Algorithm for Large-Scale Data Dimensionality Reduction

BriefGPT - AI 论文速递 ·

本研究提出了一种新方法，通过谱数据压缩加速UMAP，解决了其在大规模数据集上的效率问题。该方法在减少数据集大小的同时保持流形结构，实验结果表明嵌入质量未受影响。

通过谱粗化加速大规模数据集的UMAP

BriefGPT - AI 论文速递 ·

本研究探讨了医学分割中的熵和UMAP混合采样技术。通过心脏和前列腺数据集验证，熵-UMAP组合在Dice分数上显著优于随机基线，显示出两者间的协同作用。此外，研究提出了UMAP Mixup用于深度学习的数据增强，表现出色。

大型放射学数据集中的异常点检测使用 UMAP

BriefGPT - AI 论文速递 ·

UMAP是一种基于黎曼几何和代数拓扑的流形学习技术，适用于降维和高维数据可视化，具有良好的结构保留能力。GLoMAP和iGLoMAP是其扩展，能够有效保留局部和全局距离，适合小批量学习。UMAP Mixup是一种数据增强方案，提升深度学习模型的泛化性能。ShapeVis技术用于可视化点云数据，适合大规模数据展示。

IsUMap：利用 Vietoris-Rips 滤波的流形学习和数据可视化

BriefGPT - AI 论文速递 ·

本文介绍了一种基于序列到序列神经网络的主题建模方法，结合BERT模型、UMAP降维和K-Means聚类，从未分类文本中提取主题。研究表明，该方法在多个数据集上表现优异，并开发了交互式主题建模系统，具有显著应用价值。

主题建模的迭代方法

BriefGPT - AI 论文速递 ·

UMAP是一种基于黎曼几何和代数拓扑的降维算法，具有优良的可视化质量和结构保留能力。本文探讨了多种降维方法，如近似UMAP、NeuroLens和SLISEMAP，强调保留局部与全局结构的重要性，并提出新的设计原则和算法，以提升机器学习模型的解释性和性能。

利用领域知识探索 UMAP 投影的镜头函数

BriefGPT - AI 论文速递 ·

本研究探讨了熵与UMAP混合模型在医学分割中的应用，发现其在Dice分数上显著优于随机基线。提出的UMAP Mixup方法通过数据增强提升深度学习模型性能，展现了良好的泛化能力。此外，研究还涉及机器学习在玉米产量预测中的应用及其他领域的半监督学习方法，展示了UMAP在高维数据可视化中的优势。

基于稀疏注意力回归网络的土壤肥力预测

BriefGPT - AI 论文速递 ·

在脑机接口领域，我们引入了一种名为近似 UMAP（aUMAP）的新方法，用于实时推断，其结果显示该方法能够在减少投影速度一个数量级的同时维持与标准 UMAP 相同的训练时间和投影空间。

近似 UMAP 允许高速在线可视化高维数据流

BriefGPT - AI 论文速递 ·

本研究探讨了医学分割中熵和代表性采样技术的混合模型，使用UMAP技术捕捉代表性。熵-UMAP采样技术在Dice分数上优于随机基线，并在10种不同主动学习方法中获得最高的Dice系数。初步证据表明，在混合主动学习模型中，熵和UMAP方法之间存在协同作用。

流形增强：将混合正则化与 UMAP 结合

BriefGPT - AI 论文速递 ·

.mpipks-transcript | 10. Dimension Reduction

阿掖山：一个博客 ·