本文比较了ROC AUC和精确率-召回率(PR)曲线在处理不平衡数据集时的表现。ROC AUC适用于平衡数据,而PR曲线更能反映稀有正类的分类性能。通过三个示例,展示了在不同不平衡程度下这两种指标的差异,强调了PR曲线在高风险场景中的重要性。
本研究分析了432篇论文,探讨多模态人工智能在医学中的技术挑战及临床应用,发现其在不同医学领域的应用优势,AUC平均提高6.2个百分点,并提出发展建议,为科研人员和医生提供深入见解。
TabTransformer是一种基于自注意力变换器的深度学习架构,专为表格数据的监督和半监督学习设计。研究表明,TabTransformer在多个公开数据集上表现优越,具备良好的鲁棒性和可解释性。通过无监督预训练,该模型在半监督场景下提升了AUC。此外,研究还比较了传统机器学习与深度学习在表格数据处理上的效果,发现传统方法在某些任务上仍具优势。
本研究首次发现长序列推荐模型中,单一嵌入集难以同时学习注意力和表示。为此,提出了DARE模型,通过独立嵌入表提高推荐准确性和搜索速度。实验表明,DARE在公共数据集上AUC提升0.9%,并在在线系统中表现优异。
本研究提出了一种结合CNN和弱监督学习的语义分割方法,通过显著性和注意力地图提升性能,无需精确标签。采用新损失函数和对比学习解决数据不平衡问题,增强模型鲁棒性。同时,研究关注长尾语义分割,提出改进算法和评估系统,推动相关领域的实证研究。
本研究综述了深度学习和机器学习在乳腺癌基因测序和影像检测中的应用,比较了多种分类模型的生存率预测能力,探讨了因果贝叶斯网络和机器学习在癌症风险评估中的潜力,提出了基于电子健康记录的新方法,强调了人工智能在个性化治疗中的重要性,并评估了联邦学习在癌症研究中的优势。
本研究提出了基于Transformer的few-shot class-incremental learning (FSCIL)框架,通过引入新的评估指标gAcc和使用基于gAcc的AUC总体度量,以及利用远距离层级的中间特征来改善特征的泛化能力,优化novel-class的性能。
ACM FAccT最近发表的一篇关于使用AUC ROC进行预测分析的文章存在技术性错误,重新定义了问题并讨论了如何在考虑这些问题的基础上继续使用AUC ROC。文章提出了多种度量标准的联合使用,并强调不应仅仅依赖AUC ROC。
本文质疑使用接受者操作特征下的面积(AUC)是否是衡量异常检测性能的合适标准,并提出了可能存在的偏差性。作者发现,在低假阳率下的AUC表现良好,并且仅在具有代表性的异常样本时才能比较异常检测器。结果提示在许多情况下,应进行主动或少数样本学习而不是纯粹的异常检测。
本文提出了一种基于学习的方法来检测真实和虚假的deepfake多媒体内容。通过分析音频和视觉模态的相似性以及情感线索,推断输入视频的真实性。实验结果表明,该方法在DeepFake-TIMIT和DFDC数据集上的AUC分别达到了84.4%和96.6%。
本文研究了基于替代损失函数的学习方法的渐近一致性,证明了指数损失和逻辑损失与AUC一致,但铰链损失不一致。同时,推导了一些与AUC一致的损失函数,并发现AdaBoost和RankBoost具有相同的指数代理损失。
本文提出了一种新的基于Transformer的MIL方法,探索形态和空间信息,对三个计算病理学问题进行了测试,结果表明该方法具有更好的性能和更快的收敛速度,测试AUC可以达到93.09%,在TCGA-NSCLC和TCGA-RCC数据集上,癌症亚型分类的AUC分别可以达到96.03%和98.82%。
该研究使用深度卷积神经网络进行乳腺癌筛查检查分类,AUC为0.895。结合放射科医生预测可提高准确性。
该论文提出了一种自我区分建模框架,用于检测异常图形。该框架提供了三种算法,能够在几个流行的图形数据集上显著提高 AUC 的性能。研究还发现即使是完全无监督的算法也能显著优于有监督学习算法进行异常图形检测,同时分析了对应的原因。
该文介绍了一种无监督异常声音检测(ASD)的训练技术,通过表示学习和产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间。同时,提出了一种提取重要时间区域特征的结构。实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。
该研究使用Transformer架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的注视分析。该方法在各项指标上均取得了最新的成果,对注视目标检测提高了AUC的达到2.91%、注视距离减少了50%、注视对象分类和定位平均精度提高了11-13%。
该研究使用 DRG-LLaMA 语言模型 fine-tuned 临床笔记,以改善 DRG 预测在美国住院付款系统中的分配过程。DRG-LLaMA 表现出较高的精确度和 AUC,并在预测基本 DRGs 和并发症 / 重要并发症时也取得了相对较高的准确率。
本研究在深伪检测领域取得了显著的改进,具有较强的鲁棒性和普适性,在六个基准测试中表现良好。在深伪检测挑战预览数据集上,将帧级 AUC 从 0.797 提高至 0.835,将 CelebDF_v1 数据集上的视频级 AUC 从 0.811 提高至 0.847。
本文介绍了基于ERNIE-Gram模型训练的排序模型和基于RocketQA的CrossEncoder训练的单塔模型。排序模型使用双塔模型和margin_ranking_loss进行训练,评估指标为AUC。训练环境依赖于Python和PaddlePaddle等库。代码结构包括部署、环境依赖、代码结构、数据介绍等部分。基于RocketQA的CrossEncoder训练的单塔模型用于搜索的排序阶段,对召回的结果进行重新排序。CrossEncoder模型与Pairwise模型的区别在于输入方式、训练方式、处理效率和应用场景等。
本文讨论了AUC的三个问题:ROC对不均衡样本的鲁棒性、选择PR或ROC的时机、AUC值为何大于0.5。ROC关注正负样本,PR专注于正样本,选择时需根据具体任务。AUC小于0.5时可通过反转预测概率使其大于0.5。
完成下面两步后,将自动完成登录并继续当前操作。