本文提出了一种新颖的度量方法——最大子群差异(MSD),有效解决了经典度量方法在偏见评估中的高样本复杂度问题。MSD以线性样本复杂度评估特征子群的偏差,并提供实用算法和修复路径,实证结果表明其优于其他方法。
本研究提出了一种基于异构图神经网络的模型,旨在解决系统性缺失数据下的子群特征选择问题,有效识别特征与目标变量之间的依赖关系。
本研究针对机器学习模型在数据中毒攻击中的脆弱性,特别是子群体污染攻击,提出了一个理论框架,探讨模型复杂性如何影响对这些攻击的易感性。研究发现,过参数化的模型由于其较大的能力,容易记忆并错误分类特定的子群体,进而揭示出这些模型在现实世界中可能对边缘化或代表性不足的群体造成的显著风险。
通过结合受限制的回溯学习框架和高效的图链接预测机制,研究者提出了一种新的方法,受限制的召回率优化与选择性链接预测 (RECO-SLIP),用于在具有次群体转变的带属性图中检测属于新类别的节点。实证评估证明了 RECO-SLIP 方法在性能上的优势。
本研究使用深度学习模型在胸部X射线诊断方面取得重要进展,通过重新训练预训练模型的最后分类层,并考虑公平性约束和类别平衡微调,实现了准确性和公平性的最佳权衡。在MIMIC-CXR数据集上评估了该方法。
通过引入结构回归方法进行细分评估,以演示即使对于非常小的子群体,也可以得出可靠的系统性能估计,进而提供相应的推断策略以构建置信区间,并探索拟合度检验如何揭示交叉群体所经历的公平相关伤害的结构。
本论文介绍了 Orienteering Problem(OP)的扩展,称为 Clustered Orienteering Problem with Subgroups (COPS)。COPS 将节点分成子组和簇,每个子组与奖励相关。目标是在旅行预算下最大化总奖励收集。研究提出了一个整数线性规划(ILP)模型和基于 Tabu 搜索的启发式方法来解决问题。实验结果表明,ILP 方法可以得到最优解,但时间开销较大,而元启发式方法在更合理的计算成本内产生可比较的解。
RMIX是解决超参数化神经网络中重要性加权方法效果不佳的框架,能更好地应对含不同子群比例的训练和测试分布的子群转移问题。RMIX利用混合样本上的重要性加权来获取更鲁棒的模型,并利用训练轨迹的不确定性估计来灵活地表征子群分布。理论分析验证了RMIX具有更好的广义化界限。
该文介绍了一种方法,可以发现置换群S_n的子群H。学习S_n不变函数和线性变换,可以发现S_k(k≤n)的子群,包括循环子群和二面体子群。作者提供了一个通用定理,并通过数值实验验证了结果的适用性。
哈囉,大家最近在吃什麼呢?這裡是換了一臺電腦的布丁。這篇是2021年演講的記錄,主題一樣是講述子群組探勘(subgroup discovery)。跟前一篇「子群組探勘簡介」不一樣的是,演講裡面我加入了較多例子,用比較容易理解的方式來介紹子群組探勘。這次也嘗試把演講的錄影放上來做個記錄,提供有需要的同學觀看。 大綱 /...
哈囉,大家最近在吃什麼呢?這裡是思考如何在人工智慧和可解釋性之間取得調和的布丁。我之前介紹過Weka的HotSpot,也介紹過Cortana的特殊模型探勘,而這篇則是介紹這些演算法的基本概念:子群組探勘(Subgroup Discovery)。本篇專欄也在政大人工智慧與數位教育中心的AI專欄發佈喔。 從描述性探勘、預測性探勘到子群組探勘 / From descriptive...
完成下面两步后,将自动完成登录并继续当前操作。