Java实现抓取在线视频并提取视频语音为文本
原文中文,约7400字,阅读约需18分钟。发表于: 。经过一系列尝试实践,最终能够在本地电脑实现抓取在线视频并提取视频语音为文本。后续可以继续研究相关插件在服务器上的使用以及对应功能块的失败重试等,保障转换的质量。反观上文,代码量以及流程并不多,但是在初次探索时也是充满了坑点。总之呢,借鉴前人的经验不断积累才能打磨更好的工具。作者:京东零售 王江波来源:京东云开发者社区。
最近在做大模型相关的项目,其中有个模块需要提取在线视频语音为文本并输出给用户。通过调研和实践,成功实现了抓取在线视频、视频转语音和语音转文本的功能。具体实现方案包括使用selenium提取网页中的视频、使用FFmpeg将视频分割为音频文件以及使用funasr进行语音转文本。最终能够在本地电脑实现抓取在线视频并提取视频语音为文本。