小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
RePro推出面向生产工作流程的软件桌面编码器

RePro Stream推出了桌面流媒体编码器Pulsar,支持实时传输最多四个信号,降低直播成本和设置时间。用户可通过互联网直接发送QTAKE输出,适合创意团队实时协作,支持超低延迟流媒体。Pulsar现提供测试版,兼容Mac和Windows,Linux版本即将推出。

RePro推出面向生产工作流程的软件桌面编码器

实时互动网
实时互动网 · 2026-01-13T02:14:26Z
Meta AI开源感知编码器视听(PE-AV):为SAM音频和多模态检索提供支持的视听编码器

Meta推出了感知编码器视听模型(PE-AV),该模型通过对1亿个带字幕的音视频对进行训练,实现音频、视频和文本的对齐表示。PE-AV在多个基准测试中表现优异,支持跨模态检索和理解,并结合两阶段数据引擎生成合成字幕,提高了多模态监督的效率。

Meta AI开源感知编码器视听(PE-AV):为SAM音频和多模态检索提供支持的视听编码器

实时互动网
实时互动网 · 2025-12-23T02:52:47Z

T5Gemma模型再更新,谷歌还在坚持编码器-解码器架构

机器之心
机器之心 · 2025-12-19T03:59:00Z

T5Gemma 2是基于Gemma 3的多模态长上下文编码器-解码器模型,采用绑定词嵌入和合并注意力机制,显著减少参数量。它支持图像与文本处理,具备更大的上下文窗口和多语言能力,适合快速实验和应用。

T5Gemma 2:下一代编码器-解码器模型

The Keyword
The Keyword · 2025-12-18T18:30:00Z
英特尔视频处理库新增 AI 辅助视频编码器功能

英特尔发布了libvpl 2.16版本,新增AI辅助视频编码的实验性API,支持显著性编码和自适应目标使用方案。具体实现细节尚未公布,用户可在GitHub上获取该版本。

英特尔视频处理库新增 AI 辅助视频编码器功能

实时互动网
实时互动网 · 2025-12-18T01:55:31Z
Interspeech 2026 第二届音频编码器能力挑战赛正式启动

国际语音会议Interspeech 2026将于2026年9月在悉尼举行,期间将举办音频编码器能力挑战赛(AECC)。比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型,主办方提供评估系统。参赛者可使用公开数据集,报名截止日期为2026年1月25日。

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

实时互动网
实时互动网 · 2025-12-16T01:55:24Z
可扩展多模态模型服务的编码器解耦

现代大型多模态模型(LMM)在服务时效率低下,因视觉编码器与文本生成阶段共享资源。通过将视觉编码器独立服务化,可以实现流水线执行,消除干扰,提高吞吐量并降低延迟,从而优化资源分配和提升多模态请求处理效率。

可扩展多模态模型服务的编码器解耦

vLLM Blog
vLLM Blog · 2025-12-15T00:00:00Z

超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025

机器之心
机器之心 · 2025-11-21T04:37:51Z
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

自编码器在地质勘查中广泛应用,尤其在异常识别方面。深度自编码器(DAE)通过无监督学习和非线性特征提取,有效处理复杂地质数据,识别潜在成矿模式,推动成矿预测的发展。

大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

Seraphineの小窝
Seraphineの小窝 · 2025-11-11T11:12:45Z
GStreamer 1.26.7 发布,改进了对 NVIDIA Jetson AV1 编码器的支持

GStreamer 发布了 1.26.7 版本,增强了对 NVIDIA Jetson AV1 编码器的支持,新增了 rtspsrc 元素的 TCP 模式,提升了 GoPro 视频性能,修复了多个元素的问题,并将 Meson 更新至 1.9.0 版本。

GStreamer 1.26.7 发布,改进了对 NVIDIA Jetson AV1 编码器的支持

实时互动网
实时互动网 · 2025-10-15T02:35:28Z
基于自编码器变换器模型的软件缺陷预测

机器学习模型依赖数据,构建包容性系统需重视代表性数据集的设计。目前新手工具较少,难以促进数据设计实践的学习。我们提出了四种数据设计实践(DDPs)。

基于自编码器变换器模型的软件缺陷预测

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-15T00:00:00Z
Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

Hugging Face发布了mmBERT,这是一种新型多语言编码器,训练于超过3万亿个标记,涵盖1,833种语言。该模型通过渐进式训练,从60种高资源语言扩展到所有语言,显著提升了多语言理解能力,并在多个评估中超越了早期的多语言编码器,展现了高效性与覆盖率的平衡。

Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

InfoQ
InfoQ · 2025-09-29T20:10:00Z
Plex 选择在 Oracle 云基础设施上运行 Bitmovin 的 VOD 编码器

Bitmovin 宣布 Plex 选择其 VOD 编码器在 Oracle 云上支持 TVOD 和 PVOD 服务,该编码器提升视频质量并降低 CDN 和存储成本,Plex 的成本分别降低 23% 和 55%。

Plex 选择在 Oracle 云基础设施上运行 Bitmovin 的 VOD 编码器

实时互动网
实时互动网 · 2025-08-29T02:16:14Z
为什么每个人都在衡量编码器的计算效率

流媒体视频运营团队追求高质量观看体验与成本降低,转码是关键成本因素。选择合适的转码解决方案(如CPU、GPU或ASIC)可优化资本与运营成本。基于ASIC的转码器在功耗、性能和可扩展性方面表现最佳,适合高需求环境。

为什么每个人都在衡量编码器的计算效率

实时互动网
实时互动网 · 2025-08-15T03:46:33Z
单通道视频编码器市场预计到 2032 年将达到 4.23 亿美元

预计到2024年,全球单通道视频编码器市场将达到2.89亿美元,2032年增至4.23亿美元,年均增长5.5%。亚太地区因高清视频需求和IP监控扩展而增长最快,便携式编码器市场年均增长率为9.2%。AI技术和5G网络的应用推动市场发展,以满足高分辨率视频流的需求。

单通道视频编码器市场预计到 2032 年将达到 4.23 亿美元

实时互动网
实时互动网 · 2025-07-22T08:09:11Z
通过预训练的生成音频编码器和声码器实现高效且适应性强的语音增强

小米的MiLM Plus提出了一种轻量级的语音增强方法,利用预训练音频模型提取特征,通过音频编码器和降噪编码器生成清晰语音,性能优于传统模型,计算效率高。实验结果显示,该系统在语音质量和说话人保真度上具有显著优势。

通过预训练的生成音频编码器和声码器实现高效且适应性强的语音增强

实时互动网
实时互动网 · 2025-07-17T02:17:33Z

编码器-解码器架构的复兴?谷歌一口气发布32个T5Gemma模型

机器之心
机器之心 · 2025-07-10T09:07:01Z

PaddleSpeech是基于飞桨的开源语音项目,最新发布的1.5.0版本适配飞桨3.0,新增DAC模型支持和AudioTools模块,优化了音频处理功能和损失函数,提高了模型的准确性和易用性。

重磅更新!PaddleSpeech r1.5.0 整体适配飞桨框架3.0,新增大模型音频编码器DAC组件

百度大脑
百度大脑 · 2025-06-23T12:33:29Z
调调编码器的CRF,它背后的唯物辩证法

CRF值调节在视频编码中影响画质与码率的平衡。提高CRF可降低码率但画质下降,反之亦然。调节CRF是解决视频编码中画质与成本矛盾的有效方法,体现了视频编解码领域的持续发展与挑战。

调调编码器的CRF,它背后的唯物辩证法

实时互动网
实时互动网 · 2025-05-23T02:51:37Z
FFmpeg FFV1 Vulkan 编码器对 AMD 的性能提升了 +35%,对 NVIDIA 的性能提升了 50%

FFmpeg 开发者正在优化基于 Vulkan 的 FFV1 编解码器,AMD 和 NVIDIA GPU 性能分别提升了 35% 和 50%。新提交通过解码器缓存的 EC 写入器显著提高了编码效率。

FFmpeg FFV1 Vulkan 编码器对 AMD 的性能提升了 +35%,对 NVIDIA 的性能提升了 50%

实时互动网
实时互动网 · 2025-05-23T01:53:04Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码