OpenAI语音转录工具被曝严重幻觉:转录100小时,一半儿在瞎扯

💡 原文中文,约2100字,阅读约需5分钟。
📝

内容提要

OpenAI的Whisper语音转录工具被发现存在严重幻觉问题,转录100小时的内容中约有一半不准确。尽管OpenAI警告不应在高风险领域使用,但已有多家医疗机构在使用该工具。研究显示,Whisper在背景噪音下更易产生幻觉。OpenAI表示将改进模型以减少此问题。

🎯

关键要点

  • OpenAI的Whisper语音转录工具存在严重幻觉问题,转录100小时的内容中约有一半不准确。

  • OpenAI警告不应在高风险领域使用Whisper,但已有多家医疗机构在使用该工具。

  • Whisper是开源自动语音识别系统,采用编码器-解码器Transformer架构,经过68万小时的多语言训练。

  • Whisper在背景噪音下更易产生幻觉,许多研究人员和工程师反映其频繁出现幻觉。

  • Nabla公司基于Whisper开发的工具已被超过30000名临床医生使用,转录约700万次医疗就诊。

  • Nabla表示正在解决Whisper产生幻觉的问题,但由于数据安全原因,无法将生成的文本与原始录音进行比较。

  • OpenAI表示将改进模型以减少幻觉现象,并感谢研究人员的反馈。

延伸问答

Whisper语音转录工具的主要问题是什么?

Whisper语音转录工具存在严重的幻觉问题,转录100小时的内容中约有一半不准确。

OpenAI对Whisper的使用有什么警告?

OpenAI警告不应在高风险领域使用Whisper,因为其准确性缺陷可能导致明显偏差。

Whisper工具在医疗领域的应用情况如何?

超过30000名临床医生和40个医疗系统已使用基于Whisper的工具,转录约700万次医疗就诊。

Whisper产生幻觉的原因是什么?

Whisper在背景噪音、停顿或音乐播放时更易产生幻觉,但具体原因尚不明确。

Nabla公司如何应对Whisper的幻觉问题?

Nabla表示正在解决Whisper产生幻觉的问题,但由于数据安全原因,无法将生成的文本与原始录音进行比较。

Whisper的技术背景是什么?

Whisper是开源自动语音识别系统,采用编码器-解码器Transformer架构,经过68万小时的多语言训练。

➡️

继续阅读