小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种基于自由论辩的图像分类器解释方法,旨在提高深度学习模型的透明度。通过代理之间的辩论,该方法能够更准确地反映分类器的推理过程,其评估结果优于传统的解释方法。

A Method for Explaining Image Classifiers Based on Free Argumentative Exchanges

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究探讨了区分人类生成文本与大型语言模型(LLM)生成文本的挑战,提出了基于LLM的检测和解释方法。结果表明,LLM在检测自身生成文本时表现优于他人生成文本,但仍需改进。将二分类任务扩展为三分类任务显著提高了检测准确性和解释质量。

"I Know Myself, But Not Really Deeply": Using Large Language Models to Detect and Explain LLM-Generated Texts

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-18T00:00:00Z

本研究评估了机器学习模型解释方法的特征重要性估计质量,发现这些估计对数据属性敏感,并在不同情境下存在显著差异,为选择合适的解释方法提供了重要见解。

Feature Importance Depends on Data Properties: Choosing the Right Explanations for Data and Decision Tree-Based Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-11T00:00:00Z

本研究提出了SemanticLens,一种通用的神经网络解释方法,旨在解决人工智能模型的不透明性问题。该方法通过将隐藏知识映射到语义结构化的多模态空间,增强模型的可验证性和信任度,促进组件级理解,填补人工智能与传统工程系统之间的信任差距。

Mechanistic Understanding and Validation of Large AI Models Using SemanticLens

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-09T00:00:00Z

本研究提出了一种快速且具不确定性感知的解释方法,结合了ConformaSight的扰动技术与校准解释的核心元素,显著提升了机器学习模型在高风险实时应用中的计算效率。

Rapid Calibrated Explanations: Efficient and Uncertainty-Aware Interpretations of Machine Learning Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-28T00:00:00Z

本研究提出了三种新型解释方法,解决了现有推理解释方法在特征之间存在约束时可能导致冗余或多余解释的问题。通过引入解释的覆盖概念,可以有效筛选冗余解释,并分析了不同类型解释的复杂性及其形式属性。这项工作对提高分类器的可解释性具有重要意义。

Reasoning Explanations for Classifiers under Constraints: Complexity and Properties

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-09-18T00:00:00Z

本论文提出了基于视觉显著性地图的人脸识别解释框架,包括定义解释方法、提出新模型CorrRISE和新评估方法。实验证明,CorrRISE生成有洞察力的显著性地图,在相似性地图方面表现出卓越性能。

AI 基于人脸识别系统的全面视觉显著性解释框架的研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-08T00:00:00Z

OpenXAI 是一个开源框架,用于评估和基准测试解释方法,包含合成数据生成器和真实数据集,提供22种度量标准以评估解释的准确性和公平性。此外,研究介绍了 AI Fairness 360 和 fairlib 等工具,旨在提高算法公平性和模型可解释性。

FairX: 使用公平性,效用性和可解释性的综合性模型分析基准工具

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-20T00:00:00Z

该研究探讨了图神经网络(GNNs)可解释性不足的问题,分析了数据生成、评估指标和解释呈现等领域的挑战,并提出了改进建议,评估了不同解释方法的性能,强调了未来研究方向。

图形神经网络解释是脆弱的

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-05T00:00:00Z

本文探讨了可解释人工智能(XAI)的多个维度,包括格式、完备性、准确性和时效性,以及信任和透明度等效应。研究表明,用户对不同解释方法的偏好受背景因素影响,强调在设计XAI系统时需考虑用户需求。此外,分析了现有技术的限制,并探讨了自定义损失函数在模型泛化能力上的应用。

增量式可解释性人工智能:逐步解释的可记忆理解

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-10T00:00:00Z

研究发现文本分类器中的解释方法易受干扰,需要进行忠实和稳健的解释方法以防止解释被扰动改变。新的解释攻击算法TEF可以改变解释结果但保持分类器预测不变。评估发现所有模型和解释方法都容易受到TEF扰动的影响,表明文本分类器中的解释非常脆弱。

TextFooler 黑盒对 01 损失符号激活神经网络集成攻击的准确性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-12T00:00:00Z

本文研究了机器学习模型解释方法对模型可解释性的影响,并通过模拟测试评估了五种解释方法的有效性。结果显示LIME方法在分类表格方面有效,Prototype方法在反事实模拟测试中也有效。需要谨慎处理解释方法的评估指标,当前方法仍有改进空间。

ALMANACS: 一种用于语言模型解释可解释性的可模拟性基准测试

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-20T00:00:00Z

Counterfactuals是一个R包,提供了模块化和统一的R6接口来解释Counterfactual解释方法,并提出了一些可选的方法学扩展。它还将这些方法应用于不同的情境,并对解释质量和运行效率进行了评估。

通过反事实解释黑盒模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-14T00:00:00Z

本文探讨了神经网络的解释方法,包括特征可视化、像素归因、概念检测和对抗样本。强调通过样本的剔除或添加来评估模型的重要性,并指出在模型参数调整中保持解释性对推动通用人工智能的发展至关重要。

神经网络解释性

informal
informal · 2022-11-05T16:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码