小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了“负责任人工智能实验室”(RAIL)框架,评估大型语言模型的伦理标准,展示八个可测量维度,旨在提升其在现实世界中的伦理表现。

Implementing Responsible AI Assessment in Real-World Applications: Utilizing Anthropic's Value Dataset

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-30T00:00:00Z

本文探讨了机器遗忘在大型语言模型中的应用,旨在消除不良数据影响,确保模型的安全性和可信度。研究涵盖遗忘方法、评估框架及其在隐私保护中的作用,强调机器遗忘在推动负责任人工智能方面的重要性。通过选择性删除信息,保持模型性能,解决低资源语言的安全问题。

每种语言都重要:多语言 LLMs 的学习和遗忘

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-19T00:00:00Z
微软在首份负责任人工智能透明报告中表示已取得重大进展

微软发布了首份负责任人工智能透明报告,强调2023年在安全部署AI产品方面的成就。报告指出,微软创建了30个负责任AI工具,增强了团队,并要求生成性AI应用在开发过程中评估风险。此外,微软为Azure AI客户提供了检测有害内容的工具,并扩展了红队测试,以确保AI模型的安全性。尽管面临争议,微软仍致力于负责任AI的持续改进。

微软在首份负责任人工智能透明报告中表示已取得重大进展

The Verge
The Verge · 2024-05-02T22:56:24Z

本文综述了可解释人工智能(XAI)领域内的现有文献,并对未来的研究前景进行了探讨。提出了新的可解释性定义,分类了各种机器学习模型。讨论了XAI面临的挑战,如数据融合和解释性之间的折衷。强调了“负责任人工智能”的概念,要求AI方法在实施中保证公平性、模型可解释性和可追溯性。

基于概念的可解释人工智能综述

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-12-20T00:00:00Z
让机器有意识:纽约大学教授谈负责任的人工智能

纽约大学负责任人工智能中心主任朱莉娅·斯托亚诺维奇强调负责任的人工智能和透明度。她提倡为人工智能系统提供“营养标签”,并鼓励人们要求解释并参与人工智能的治理。立法者已经实施了一项法律,以提高求职者筛选的透明度。

让机器有意识:纽约大学教授谈负责任的人工智能

NVIDIA Blog
NVIDIA Blog · 2023-10-18T13:00:49Z

本文综述了可解释人工智能(XAI)领域内的现有文献,并对未来的研究前景进行了探讨。提出了新的可解释性定义,分类了各种机器学习模型。讨论了XAI面临的挑战,如数据融合和解释性之间的折衷。强调了“负责任人工智能”的概念,要求AI方法在实施中保证公平性、模型可解释性和可追溯性。

超越可解释人工智能:面向负责任人工智能的障碍

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-07T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码