OpenAI语音转录工具被曝严重幻觉:转录100小时,一半儿在瞎扯
内容提要
OpenAI的Whisper语音转录工具被发现存在严重幻觉问题,转录100小时的内容中约有一半不准确。尽管OpenAI警告不应在高风险领域使用,但已有多家医疗机构在使用该工具。研究显示,Whisper在背景噪音下更易产生幻觉。OpenAI表示将改进模型以减少此问题。
关键要点
-
OpenAI的Whisper语音转录工具存在严重幻觉问题,转录100小时的内容中约有一半不准确。
-
OpenAI警告不应在高风险领域使用Whisper,但已有多家医疗机构在使用该工具。
-
Whisper是开源自动语音识别系统,采用编码器-解码器Transformer架构,经过68万小时的多语言训练。
-
Whisper在背景噪音下更易产生幻觉,许多研究人员和工程师反映其频繁出现幻觉。
-
Nabla公司基于Whisper开发的工具已被超过30000名临床医生使用,转录约700万次医疗就诊。
-
Nabla表示正在解决Whisper产生幻觉的问题,但由于数据安全原因,无法将生成的文本与原始录音进行比较。
-
OpenAI表示将改进模型以减少幻觉现象,并感谢研究人员的反馈。
延伸问答
Whisper语音转录工具的主要问题是什么?
Whisper语音转录工具存在严重的幻觉问题,转录100小时的内容中约有一半不准确。
OpenAI对Whisper的使用有什么警告?
OpenAI警告不应在高风险领域使用Whisper,因为其准确性缺陷可能导致明显偏差。
Whisper工具在医疗领域的应用情况如何?
超过30000名临床医生和40个医疗系统已使用基于Whisper的工具,转录约700万次医疗就诊。
Whisper产生幻觉的原因是什么?
Whisper在背景噪音、停顿或音乐播放时更易产生幻觉,但具体原因尚不明确。
Nabla公司如何应对Whisper的幻觉问题?
Nabla表示正在解决Whisper产生幻觉的问题,但由于数据安全原因,无法将生成的文本与原始录音进行比较。
Whisper的技术背景是什么?
Whisper是开源自动语音识别系统,采用编码器-解码器Transformer架构,经过68万小时的多语言训练。