小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

GStreamer 1.28 发布,新增 Vulkan H.264 编码器、AMD HIP 插件和 Wayland 支持。引入 Rust 编写的音频源分离、YOLOX 推理元素及 GIF 解码器,增强分析 API 和 MP4 解复用支持,同时改进日志管理和管道图支持。

GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

实时互动网
实时互动网 · 2026-01-28T02:41:56Z
GStreamer 1.28 候选版本现已发布,可供测试,并附带 Rust 插件

GStreamer 项目发布了 GStreamer 1.28 的第一个候选版本,新增 YOLOX 推理元素、音频源分离元素和 GIF 解码器,支持 AAC、无缝循环及 ISO/IEC 23003-5 标准音频,预计将引入 Vulkan H.264 编码器等新特性。

GStreamer 1.28 候选版本现已发布,可供测试,并附带 Rust 插件

实时互动网
实时互动网 · 2026-01-07T01:55:36Z

本研究探讨了CEEMDAN算法在音频源分离中的有效性,指出其在分离混合信号方面存在局限性。尽管CEEMDAN能改善语音质量,但对不同语音信号的分离效果仍不理想。

Performance Study of CEEMDAN in Underdetermined Speech Separation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-18T00:00:00Z

本文介绍了一种基于预训练变分自编码器的扩散模型训练技术,应用于音频源分离和音乐生成。该方法在音频-视觉分离任务中表现优异,能够生成高质量音轨,并有效实现多轨音频中的音源分离,具有广泛应用潜力。

无监督音频可组合表示

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-19T00:00:00Z

本文介绍了音频源分离模型的研究进展,包括DnR数据集更新、基于心理声学的频率划分和对抗训练的音乐源分离算法。研究表明,多语言数据训练提升了模型的泛化能力,新提出的GASS模型在音频源分离任务中表现优异,尤其在语音和音乐分离方面具有竞争力。

面对音乐:电影音频中的歌声分离挑战

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-08-07T00:00:00Z

该研究提出了一种语言查询音频源分离(LASS)任务,利用LASS-Net神经网络从音频混合物中分离目标源。实验结果表明,LASS-Net在性能和泛化能力上优于基线方法,显示出其在实际应用中的潜力。此外,研究还利用大型语言模型改善了音频与文本的对齐,提升了多种任务的性能。

基于大型语言模型的字幕增强技术提升的语言查询音频源分离性能:DCASE Challenge 2024 任务 9

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-17T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码