💡
原文中文,约1100字,阅读约需3分钟。
📝
内容提要
comfyui是一个前端交互界面,使用Stable Diffusion模型实现生图功能。它可以生成各种类型的图片和视频,包括文生图、图生图、图重绘、局部重绘、线稿上色和换背景等。生成的图片质量很好,但生成视频的效果还不成熟。此外,comfyui还可以用来训练语言模型,例如so-vits,用来模仿歌手的声音。作者记录了自己最近的学习和折腾经历,感到焦虑但也有时放纵自己玩游戏,对自己的发展感到困惑。
🎯
关键要点
- comfyui是一个使用Stable Diffusion模型的前端交互界面,具有生图功能。
- comfyui生成图片的质量较高,但生成视频的效果尚不成熟。
- comfyui支持多种工作流,包括文生图、图生图、图重绘、局部重绘、线稿上色和换背景等。
- 生成图片时存在手指变形和脸崩的问题,需要配合其他节点修复。
- 作者使用comfyui生成了多种AI图片,并对生成效果表示满意。
- 作者使用so-vits训练语言模型以模仿已故歌手本兮的声音。
- 训练过程中遇到音源处理不干净的问题,导致生成的声音质量不佳。
- 作者记录了自己的学习和折腾经历,感到焦虑和困惑,反思时间管理和个人发展。
🏷️
标签
➡️