MIT News - Artificial intelligence ·

研究：人工智能可能导致家庭监控结果不一致

💡 原文英文，约1200词，阅读约需5分钟。

📝

内容提要

麻省理工学院和宾夕法尼亚州立大学的研究发现，使用大型语言模型进行家庭监控可能会错误地建议报警，且模型在标记需要警察干预的视频时存在不一致性。研究人员还发现，模型在白人居民较多的社区中相对较少标记需要警察干预的视频，表明模型受到社区人口统计数据的影响。这种规范不一致性使得预测模型行为变得困难。研究人员呼吁对部署生成式人工智能模型的行动进行更多思考，以避免潜在的危害。由于无法访问专有AI模型的训练数据和内部运作方式，研究人员无法确定规范不一致性的根本原因。

🎯

关键要点

麻省理工学院和宾夕法尼亚州立大学的研究发现，大型语言模型在家庭监控中可能错误建议报警。
研究表明，模型在标记需要警察干预的视频时存在不一致性。
模型在白人居民较多的社区中较少标记需要警察干预的视频，显示出模型受到社区人口统计数据的影响。
这种规范不一致性使得预测模型行为变得困难，研究人员呼吁对生成式人工智能模型的部署进行更多思考。
研究人员无法确定规范不一致性的根本原因，因为无法访问专有AI模型的训练数据和内部运作方式。
研究使用了来自Amazon Ring的家庭监控视频数据集，分析了三种大型语言模型的表现。
研究发现，尽管39%的视频显示犯罪行为，但所有模型几乎总是表示没有犯罪发生。
模型在多数白人社区中较少推荐报警，且在不同社区中使用的术语存在差异。
研究人员认为，模型的偏见可能源于背景条件，但缺乏透明度使得难以确定不一致性的来源。
研究希望开发系统以帮助识别和报告AI偏见，并比较LLMs在高风险情况下的判断与人类的判断。

❓

延伸问答

大型语言模型在家庭监控中可能出现什么问题？

大型语言模型可能错误建议报警，且在标记需要警察干预的视频时存在不一致性。

研究发现模型在不同社区的表现有何不同？

模型在白人居民较多的社区中较少标记需要警察干预的视频，显示出社区人口统计数据的影响。

研究人员如何分析家庭监控视频数据？

研究人员使用来自Amazon Ring的家庭监控视频数据集，分析了三种大型语言模型的表现。

模型的规范不一致性对预测行为有什么影响？

规范不一致性使得预测模型行为变得困难，难以确定模型在不同情境下的反应。

研究人员对生成式人工智能模型的部署有何看法？

研究人员呼吁对生成式人工智能模型的部署进行更多思考，以避免潜在的危害。

研究中提到的偏见来源是什么？

研究人员认为模型的偏见可能源于背景条件，但缺乏透明度使得难以确定不一致性的来源。

🏷️

继续阅读

国家科学基金会续资麻省理工学院主导的人工智能与物理学研究所，扩展新的发现模式
麻省理工学院主导的人工智能与基础相互作用研究所（IAIFI）获得国家科学基金会续资，年资助额从400万美元增至498万美元。IAIFI致力于将人工智能与物...
台积电难以跟上人工智能需求：‘我们只能支持这么多’
台积电面临满足美国客户需求的挑战，尽管在美国扩建工厂。CEO魏哲家表示，客户需求过高，生产能力有限，可能需要很长时间才能满足。预计到2027年，半导体市场...
SKAI Intelligence与首尔大学AI研究院开展合作研究
SKAI Intelligence与首尔大学AI研究院签署合作备忘录，联合研究机器人感知与抓取技术，重点包括物理AI核心视觉、多物体识别与位姿估计，以提升...
研究人员不满微软安全团队的做法公开爆出VS Code漏洞可窃取私有凭证
安全研究员Ammar Askar披露了Visual Studio Code中的高危漏洞，该漏洞可窃取GitHub OAuth Token，导致开发者仓库受...
人工智能没有意识：华裔科幻作家拆穿AI人格化背后认知陷阱
特德·姜批评AI人格化，认为大语言模型如Claude仅是文字续写机器，并无意识。他指出，将AI视为有感情的存在会模糊责任归属，导致人类逃避道德责任。真正的...
Inspektor Gadget：首次安全审计结果
Inspektor Gadget是一个基于eBPF的开源工具，专注于Kubernetes可观察性和Linux主机检查。最近完成的安全审计发现三处漏洞，已全...