本文比较了ROC AUC和精确率-召回率(PR)曲线在处理不平衡数据集时的表现。ROC AUC适用于平衡数据,而PR曲线更能反映稀有正类的分类性能。通过三个示例,展示了在不同不平衡程度下这两种指标的差异,强调了PR曲线在高风险场景中的重要性。
本研究分析了432篇论文,探讨多模态人工智能在医学中的技术挑战及临床应用,发现其在不同医学领域的应用优势,AUC平均提高6.2个百分点,并提出发展建议,为科研人员和医生提供深入见解。
TabTransformer是一种基于自注意力变换器的深度学习架构,专为表格数据的监督和半监督学习设计。研究表明,TabTransformer在多个公开数据集上表现优越,具备良好的鲁棒性和可解释性。通过无监督预训练,该模型在半监督场景下提升了AUC。此外,研究还比较了传统机器学习与深度学习在表格数据处理上的效果,发现传统方法在某些任务上仍具优势。
本研究首次发现长序列推荐模型中,单一嵌入集难以同时学习注意力和表示。为此,提出了DARE模型,通过独立嵌入表提高推荐准确性和搜索速度。实验表明,DARE在公共数据集上AUC提升0.9%,并在在线系统中表现优异。
本研究提出了一种结合CNN和弱监督学习的语义分割方法,通过显著性和注意力地图提升性能,无需精确标签。采用新损失函数和对比学习解决数据不平衡问题,增强模型鲁棒性。同时,研究关注长尾语义分割,提出改进算法和评估系统,推动相关领域的实证研究。
本研究综述了深度学习和机器学习在乳腺癌基因测序和影像检测中的应用,比较了多种分类模型的生存率预测能力,探讨了因果贝叶斯网络和机器学习在癌症风险评估中的潜力,提出了基于电子健康记录的新方法,强调了人工智能在个性化治疗中的重要性,并评估了联邦学习在癌症研究中的优势。
本文提出了一种模型不可知的方法,通过优化AUC选择函数,并使用AUCROSS算法实现最佳平衡。研究表明,AUPRC与AUROC之间存在关联,强调了对度量标准性能深入理解的重要性。此外,提出了新的评价指标和替代损失函数,以提升分类性能和模型可信度。
本文提出了一种“置信度排名”框架,通过优化两个模型的排名函数,直接提升AUC和准确率等指标。实验结果表明,该框架在CTR预测任务中优于所有基线,并已在JD.com广告系统中应用,显著提升流量表现。
近年来,机器学习模型的复杂性迅速增加,但评估方法未能跟上。研究提出三种新度量指标,发现性能更好的模型不一定是更新或更大的模型。同时,质疑AUC作为异常检测标准的适用性,强调需要探索更真实的模型性能评估方法。建议在聚类验证中使用Precision-Recall曲线作为更合适的指标。
本研究提出了三个度量指标以解决选择性回答的局限性,发现性能更好的模型不一定是较新或较大的预训练模型。同时,质疑AUC作为异常检测性能标准的适用性,强调在低假阳率下的AUC表现。研究还提出了高效算法AUC-opt,探讨了聚类验证中的新方法,并提出优化AUC的新损失函数。
本文提出了一种基于学习的方法来检测真实和虚假的deepfake多媒体内容。通过分析音频和视觉模态的相似性以及情感线索,推断输入视频的真实性。实验结果表明,该方法在DeepFake-TIMIT和DFDC数据集上的AUC分别达到了84.4%和96.6%。
本文研究了基于替代损失函数的学习方法的渐近一致性,证明了指数损失和逻辑损失与AUC一致,但铰链损失不一致。同时,推导了一些与AUC一致的损失函数,并发现AdaBoost和RankBoost具有相同的指数代理损失。
本文提出了一种新的基于Transformer的MIL方法,探索形态和空间信息,对三个计算病理学问题进行了测试,结果表明该方法具有更好的性能和更快的收敛速度,测试AUC可以达到93.09%,在TCGA-NSCLC和TCGA-RCC数据集上,癌症亚型分类的AUC分别可以达到96.03%和98.82%。
该研究使用深度卷积神经网络进行乳腺癌筛查检查分类,AUC为0.895。结合放射科医生预测可提高准确性。
该论文提出了一种自我区分建模框架,用于检测异常图形。该框架提供了三种算法,能够在几个流行的图形数据集上显著提高 AUC 的性能。研究还发现即使是完全无监督的算法也能显著优于有监督学习算法进行异常图形检测,同时分析了对应的原因。
该文介绍了一种无监督异常声音检测(ASD)的训练技术,通过表示学习和产生紧凑的类内和互不重叠的类间分布,保证异常数据的表示空间。同时,提出了一种提取重要时间区域特征的结构。实验结果表明,该方法在 DCASE 2020 Challenge Task2 数据集上相对于最先进的方法,AUC、pAUC 和 mAUC 分别提高了 0.90%、0.83%和 2.16%。
该研究使用Transformer架构自动检测图像中的对象,并建立对象与注视的关联,实现全面的注视分析。该方法在各项指标上均取得了最新的成果,对注视目标检测提高了AUC的达到2.91%、注视距离减少了50%、注视对象分类和定位平均精度提高了11-13%。
该研究使用 DRG-LLaMA 语言模型 fine-tuned 临床笔记,以改善 DRG 预测在美国住院付款系统中的分配过程。DRG-LLaMA 表现出较高的精确度和 AUC,并在预测基本 DRGs 和并发症 / 重要并发症时也取得了相对较高的准确率。
本研究在深伪检测领域取得了显著的改进,具有较强的鲁棒性和普适性,在六个基准测试中表现良好。在深伪检测挑战预览数据集上,将帧级 AUC 从 0.797 提高至 0.835,将 CelebDF_v1 数据集上的视频级 AUC 从 0.811 提高至 0.847。
本文介绍了基于ERNIE-Gram模型训练的排序模型和基于RocketQA的CrossEncoder训练的单塔模型。排序模型使用双塔模型和margin_ranking_loss进行训练,评估指标为AUC。训练环境依赖于Python和PaddlePaddle等库。代码结构包括部署、环境依赖、代码结构、数据介绍等部分。基于RocketQA的CrossEncoder训练的单塔模型用于搜索的排序阶段,对召回的结果进行重新排序。CrossEncoder模型与Pairwise模型的区别在于输入方式、训练方式、处理效率和应用场景等。
完成下面两步后,将自动完成登录并继续当前操作。