小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

Maestri 是一款支持 AI Agents 协作的白板工具,适用于项目管理,用户可在画布上添加终端和标签等元素以提升效率。Hour by Hour 是一款日程管理应用,支持自然语言输入,方便用户安排日程。Voicebox 能克隆用户声音,制作播客。Haven 是多合一 SSH 工具,适合远程运维。Kaori 是香水记录应用,帮助用户管理香水信息。

派评 | 近期值得关注的 App

少数派
少数派 · 2026-04-27T09:55:20Z
GitHub本周十大爆火开源项目盘点:字节deer-flow与自进化智能体霸榜

本周GitHub十大开源项目聚焦语音AI与自进化智能体。微软的VibeVoice凭借声音克隆和长音频转录技术位居榜首,字节跳动的deer-flow是支持自主学习与任务分解的通用智能体框架。Hermes Agent实现自我进化记忆,提升AI助手体验。其他项目如last30days-skill和Deep-Live-Cam展示了跨平台研究与实时换脸技术,整体趋势表明AI能力获取门槛降低,推动创新与普及。

GitHub本周十大爆火开源项目盘点:字节deer-flow与自进化智能体霸榜

极道
极道 · 2026-04-03T22:42:00Z
如何在Mac上部署indexTTS2,快速语音克隆和情感控制

本文介绍了声音克隆项目的部署,包括安装git-lfs和uv包管理器及其依赖。通过终端命令下载项目和模型,首次运行较慢,但使用方便且效果良好,推荐尝试。

如何在Mac上部署indexTTS2,快速语音克隆和情感控制

张洪Heo
张洪Heo · 2025-10-02T13:59:43Z

李沐及其团队推出了语音大模型「Higgs Audio V2」,通过引入语音数据,提升了TTS系统的自然性和情感适应性。该模型具备多说话人对话生成和零样本声音克隆等创新功能,在情感交互方面表现突出,标志着音频AI的重大进步。

1000w小时语音数据!语音模型Higgs Audio V2情感能力跃迁;MathCaptcha10k提升验证码识别技术

HyperAI超神经
HyperAI超神经 · 2025-08-11T05:22:09Z
如何在本地安装Nari Dia 1.6B?

Nari Labs的Dia 1.6B是一款先进的文本转语音模型,能够将文本转换为生动且富有情感的音频对话。它支持动态对话标签,允许用户克隆声音并控制语调和情感,适用于媒体内容和对话界面。虽然目前主要优化为英语,Dia旨在提供自然流畅的语音生成体验。

如何在本地安装Nari Dia 1.6B?

DEV Community
DEV Community · 2025-05-05T15:31:27Z

本文解决了声音克隆领域术语不统一和研究方向分散的问题,提出标准化术语并探讨不同变体,旨在系统化现有算法,促进生成与检测研究,防止滥用。

声音克隆:综合研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-01T00:00:00Z

春节档电影《哪吒 2》票房突破120亿,成为中国首部票房过百亿影片,跻身全球影史前10。配音艺术引发热议,声音克隆技术迅速发展,普通人可轻松复刻角色音色。三款主流开源模型(GPT-SoVITS、Fish Speech v1.4、F5-E2 TTS)各具特色,广泛应用于影视创作和趣味配音。

在线教程丨3款声音克隆模型真实测评,GPT-SoVITS精准拿捏「石矶娘娘」特点

HyperAI超神经
HyperAI超神经 · 2025-02-18T06:21:40Z

随着声音克隆技术的快速发展,AI已能生成逼真的语音,但仍面临零样本学习和情感控制的挑战。E2 TTS和F5 TTS通过新方法提升语音合成质量,支持多语言和情感调节。hyper.ai官网提供相关教程和数据集,助力研究与应用。

3秒实现多音色混合克隆!F5/E2 TTS教程上线;PsyDTCorpus 5k 心理对话数据集发布,精准模拟心理咨询师语言风格

HyperAI超神经
HyperAI超神经 · 2024-11-08T09:56:36Z
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

港中大(深圳)与趣丸科技推出了新一代声音克隆TTS模型MaskGCT,该模型基于10万小时的多语言数据训练,具备超自然的语音克隆和风格迁移能力,采用两阶段结构,无需文本与语音对齐,表现优于现有TTS系统,适用于短剧出海等多种场景。

国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类

机器之心
机器之心 · 2024-10-30T05:07:00Z

韩国N号房事件再次发生,这次是Deepfake,波及超过200所学校,其中10名受害者中有3人是未成年人。Deepfake技术已经进化到了“恐怖”阶段,包括声音克隆和唇形同步技术。韩国政府计划将Deepfake犯罪的刑期从5年提高到7年。科技企业正在开发AI工具来检测Deepfake。科学研究面临Deepfake带来的挑战,需要制定道德标准和开发检测工具。

韩国N号房卷土重来,这一次是Deepfake,波及超200所学校

量子位
量子位 · 2024-08-30T05:29:52Z
Mac安装OpenVoice教程:免费的声音克隆

本文介绍了在Mac上安装和使用声音克隆工具OpenVoice的步骤和指南,使用户能够轻松进行声音克隆。

Mac安装OpenVoice教程:免费的声音克隆

张洪Heo
张洪Heo · 2024-01-15T03:12:20Z
别再被同质化的内容淹没!用 AI 克隆技术打造你独特的声音品牌!

本文介绍使用VITS-fast-fine-tuning工具克隆自己声音制作个性化音频的方法和注意事项,强调声音在个人品牌中的重要性,提出AI和声音克隆技术的联合运用可以生成具有个性特色的音频内容。

别再被同质化的内容淹没!用 AI 克隆技术打造你独特的声音品牌!

LearnData 开源笔记
LearnData 开源笔记 · 2023-10-07T00:00:00Z
声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

本文介绍如何使用PaddleSpeech克隆声音并制作鬼畜视频,需要准备干净的声音样本,进行数据集清洗和切分,可在云端或本地部署训练和推理,提供国师克隆语音模型下载链接和鬼畜视频。

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

刘悦
刘悦 · 2023-06-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码