离线生成双语字幕,一键生成中英双语字幕,基于AI大模型,ModelScope
原文中文,约4300字,阅读约需11分钟。发表于: 。制作双语字幕的方案网上有很多,林林总总,不一而足。制作双语字幕的原理也极其简单,无非就是人声背景音分离、语音转文字、文字翻译,最后就是字幕文件的合并,但美中不足之处这些环节中需要接口api的参与,比如翻译字幕,那么有没有一种彻底离线的解决方案?让普通人也能一键制作双语字幕,成就一个人的字幕组?人声背景音分离如果视频不存在嘈杂的背景音,那么大多数情况下是不需要做人声和背景音分离的,但考虑到背景...
本文介绍了离线制作双语字幕的解决方案,包括人声背景音分离、语音转文字、字幕翻译和合并字幕等步骤。使用了FRCRN语音降噪模型、faster-whisper语音转文字工具和CSANMT连续语义增强机器翻译模型。最后通过ffmpeg工具合并字幕。整个过程简单易操作,适合普通人使用。