freeCodeCamp.org ·

如何使用Gemini API构建视频字幕生成器

💡 原文英文，约2700词，阅读约需10分钟。

📝

内容提要

本教程介绍如何使用谷歌的Gemini API构建AI字幕生成器，项目采用React作为前端，Express作为后端，支持视频上传、字幕生成及下载功能。

🎯

🔎

在开始构建AI字幕生成器之前，确保你具备React和Express的基础知识。此外，获取Gemini API的密钥是至关重要的。没有这个密钥，所有请求将被拒绝，无法访问Gemini的服务。确保妥善保管你的API密钥，以免泄露给不当使用者。

本项目通过前端React与后端Express进行交互，处理视频上传和字幕生成。前端使用FormData对象将视频文件以键值对的形式发送到后端，后端则负责接收文件并与Gemini API进行交互。注意，文件上传的处理需要确保服务器能够正确解析请求中的文件数据。

在配置Gemini API时，可以设置安全选项以过滤潜在有害内容。这些设置允许开发者定义对不当内容的处理阈值，确保生成的字幕符合安全标准。建议在实际应用中根据需求调整这些设置，以提高内容的安全性和合规性。

❓

访问Google AI Studio，点击“获取API密钥”，然后创建并复制新的API密钥。

前端使用React框架，并通过Vite创建项目。

在前端使用FormData对象将视频文件作为键值对发送到后端，后端使用Express处理文件上传。

后端使用Express与Gemini API进行交互，通过API密钥验证请求并处理字幕生成。

前端接收到生成的字幕后，使用Blob对象创建下载链接，触发用户下载.srt文件。

需要了解React和Express的基础知识。

🏷️