小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

GStreamer 1.28 发布,新增 Vulkan H.264 编码器、AMD HIP 插件和 Wayland 支持。引入 Rust 编写的音频源分离、YOLOX 推理元素及 GIF 解码器,增强分析 API 和 MP4 解复用支持,同时改进日志管理和管道图支持。

GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

实时互动网
实时互动网 · 2026-01-28T02:41:56Z
GStreamer 1.28 候选版本现已发布,可供测试,并附带 Rust 插件

GStreamer 项目发布了 GStreamer 1.28 的第一个候选版本,新增 YOLOX 推理元素、音频源分离元素和 GIF 解码器,支持 AAC、无缝循环及 ISO/IEC 23003-5 标准音频,预计将引入 Vulkan H.264 编码器等新特性。

GStreamer 1.28 候选版本现已发布,可供测试,并附带 Rust 插件

实时互动网
实时互动网 · 2026-01-07T01:55:36Z

本研究探讨了CEEMDAN算法在音频源分离中的有效性,指出其在分离混合信号方面存在局限性。尽管CEEMDAN能改善语音质量,但对不同语音信号的分离效果仍不理想。

Performance Study of CEEMDAN in Underdetermined Speech Separation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本文介绍了一种基于预训练变分自编码器的扩散模型训练技术,应用于音频源分离和音乐生成。该方法在音频-视觉分离任务中表现优异,能够生成高质量音轨,并有效实现多轨音频中的音源分离,具有广泛应用潜力。

无监督音频可组合表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本文介绍了音频源分离模型的研究进展,包括DnR数据集更新、基于心理声学的频率划分和对抗训练的音乐源分离算法。研究表明,多语言数据训练提升了模型的泛化能力,新提出的GASS模型在音频源分离任务中表现优异,尤其在语音和音乐分离方面具有竞争力。

面对音乐:电影音频中的歌声分离挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

该研究提出了一种语言查询音频源分离(LASS)任务,利用LASS-Net神经网络从音频混合物中分离目标源。实验结果表明,LASS-Net在性能和泛化能力上优于基线方法,显示出其在实际应用中的潜力。此外,研究还利用大型语言模型改善了音频与文本的对齐,提升了多种任务的性能。

基于大型语言模型的字幕增强技术提升的语言查询音频源分离性能:DCASE Challenge 2024 任务 9

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码