💡
原文英文,约2900词,阅读约需11分钟。
📝
内容提要
本文介绍了作者在构建 Persumi 平台时选择使用 Google TTS 的经历,认为这些大公司拥有更多的资源和专业知识来训练更好的模型。最终结果是 TTS 的声音比以前好,运行成本不高,不再需要复杂的 Python 和 FFmpeg 调用,Fly 基础设施也变得简单和不可变。作者还使用了 Google 的 PaLM 2 进行文本摘要和 ChatGPT-like AI 提示服务,以支持 Persumi 的 AI 写作辅助功能。作者希望读者能够注册账户并提供反馈。
🎯
关键要点
- 作者介绍了构建Persumi平台的经历,选择使用Google TTS。
- 大公司拥有更多资源和专业知识,能够训练更好的模型。
- TTS的声音质量显著提高,运行成本低,不再需要复杂的Python和FFmpeg调用。
- Fly基础设施变得简单和不可变。
- 作者使用Google的PaLM 2进行文本摘要和AI提示服务,支持Persumi的AI写作辅助功能。
- Persumi是一个内容创作平台,注重内容而非广告和用户不友好的功能。
- MVP的构建过程耗时3-4个月,包含基本功能和两个“英雄”功能。
- “英雄”功能包括用户可以拥有多个“角色”和AI生成的音频内容。
- 基础设施使用Elixir和Phoenix框架,选择Postgres作为数据库。
- 使用Tailwind CSS简化前端开发,选择Meilisearch和Algolia作为搜索引擎。
- Fly和Neon用于全球分布式基础设施,Fly提供简单易用的服务。
- 最初选择本地运行机器学习模型,但最终转向使用Google的TTS服务。
- 集成Google的API后,Persumi的AI写作辅助功能得到了增强。
- 作者希望读者注册账户并提供反馈。
🏷️
标签
➡️