AI素养已成为现代社会的基本技能。freeCodeCamp推出了一门课程,帮助人们理解AI的工作原理,强调其自主性和适应性。通过设计AI图像分类器,学习AI错误的原因及其环境影响。课程提醒我们,AI是工具,人类需对结果负责。
本研究探讨了图像分类器对以文字为导向的失真的鲁棒性,并利用扩散模型对图像进行不同域的编辑。研究结果显示,不同语言为基础的失真和编辑域中,图像分类器性能下降,卷积模型比变压器架构更鲁棒,数据扩充技术可提高原始数据和编辑图像性能。
本研究提出了一种名为MoXI的方法,用于理解图像分类器的行为。该方法通过识别具有高预测置信度的像素,考虑了像素之间的相互影响和合作影响。实验证明,MoXI方法比其他可视化方法更好地识别出对模型输出有高度贡献的像素。同时,本研究还解决了计算成本的问题。
该文介绍了一种数学严谨的方法,用于近似高维数据的类流形的微分几何,并实现了流形上的对抗训练的投影梯度下降算法,以解决神经网络对对抗性攻击的敏感性问题。该方法应用于神经网络图像分类器的设置中,在流形上生成新颖的数据样本。
该文介绍了一个交互式系统,用户可以操作图像,探索深度学习图像分类器的稳健性和灵敏度。该系统允许用户比较和对比人类和机器学习模型用于分类的图像区域,揭示了一系列惊人的结果。
介绍了BIOSCAN-Insect数据集,由专家手动标注,包含百万图像和遗传信息,具有长尾类别不平衡分布的特点,分类标签是分层分类方案,将促进机器学习社区对生物多样性研究的兴趣,推动创建基于图像的分类器的进展,为全球生物多样性的综合调查奠定基础。
该研究将多模态大型语言模型视为图像分类器,并引入EMT评估现有的MLLM在图像分类任务上的性能。研究发现,几乎所有评估的MLLM在标准图像分类任务上无法保持与视觉编码器相同的性能水平,并且随着fine-tuning的进行,MLLM开始产生幻觉,并导致了显著的泛化能力损失。因此,MLLM在标准图像分类任务上的性能仍有待提高。
完成下面两步后,将自动完成登录并继续当前操作。