小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
沉浸式翻译 immersive translate
HandBrake 1.11 新增了 ProRes、DNxHR 编码器和 MOV 输出格式

开源视频转码器HandBrake发布1.11.0版本,新增DNxHR和ProRes编码器,支持最高4K分辨率的MOV输出,增加AMD VCN AV1编码器,扩展FFV1保存预设,并改进Linux版本的文件处理和用户界面设置。

HandBrake 1.11 新增了 ProRes、DNxHR 编码器和 MOV 输出格式

实时互动网
实时互动网 · 2026-03-09T02:50:01Z
彻底告别VE与VAE!商汤硬核重构多模态:砍掉所有中间编码器

商汤科技与南洋理工大学推出NEO-unify,重构多模态模型,去除视觉编码器和变分自编码器,实现统一的端到端架构。该模型通过混合变换器架构,提升视觉与语言的理解与生成能力,标志着多模态AI向统一智能体的进化。

彻底告别VE与VAE!商汤硬核重构多模态:砍掉所有中间编码器

量子位
量子位 · 2026-03-07T04:39:02Z
Net Insight Nimbra Edge与Nimbra 400获得YouTube直播编码器认证

YouTube Live 将 Net Insight 的 Nimbra Edge 和 Nimbra 400 系列纳入认证编码器名单,确认其与 YouTube 的兼容性和性能。这增强了广播公司在实时分发中的信心,确保编码器经过严格测试,降低直播风险。

Net Insight Nimbra Edge与Nimbra 400获得YouTube直播编码器认证

实时互动网
实时互动网 · 2026-03-05T02:25:38Z

摘要:本文提出X-VLA模型,通过SoftPrompt机制解决跨具身机器人学习中的异质性问题。该模型为不同数据源分配可学习嵌入,有效整合硬件配置差异,提升泛化能力。训练分两阶段:先在异构数据上预训练通用策略,再通过微调适配新具身形态。实验表明,X-VLA能在仅增加少量参数的情况下,显著提升模型对多样化机器人系统的适应能力,为具身智能的跨平台部署提供新思路。(149字)

X-VLA——基于Soft Prompt的Transformer编码器练就可扩展的跨本体VLA:VLM做多模态感知,DiT-style做动作生成

结构之法 算法之道
结构之法 算法之道 · 2026-02-21T05:00:30Z
Haivision 成为美国职业棒球小联盟官方视频编码器

美国职业棒球小联盟(MiLB)选定Haivision的Makito X4视频编码器作为官方设备,支持120支球队的赛事直播,预计每赛季直播超过8000场赛事,提升低延迟信号传输和内容分发效率。Makito X4系统将于2026赛季逐步部署。

Haivision 成为美国职业棒球小联盟官方视频编码器

实时互动网
实时互动网 · 2026-02-12T03:43:49Z
GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

GStreamer 1.28 发布,新增 Vulkan H.264 编码器、AMD HIP 插件和 Wayland 支持。引入 Rust 编写的音频源分离、YOLOX 推理元素及 GIF 解码器,增强分析 API 和 MP4 解复用支持,同时改进日志管理和管道图支持。

GStreamer 1.28开源多媒体框架发布,新增支持Vulkan H.264编码器等多项功能

实时互动网
实时互动网 · 2026-01-28T02:41:56Z
RePro推出面向生产工作流程的软件桌面编码器

RePro Stream推出了桌面流媒体编码器Pulsar,支持实时传输最多四个信号,降低直播成本和设置时间。用户可通过互联网直接发送QTAKE输出,适合创意团队实时协作,支持超低延迟流媒体。Pulsar现提供测试版,兼容Mac和Windows,Linux版本即将推出。

RePro推出面向生产工作流程的软件桌面编码器

实时互动网
实时互动网 · 2026-01-13T02:14:26Z
Meta AI开源感知编码器视听(PE-AV):为SAM音频和多模态检索提供支持的视听编码器

Meta推出了感知编码器视听模型(PE-AV),该模型通过对1亿个带字幕的音视频对进行训练,实现音频、视频和文本的对齐表示。PE-AV在多个基准测试中表现优异,支持跨模态检索和理解,并结合两阶段数据引擎生成合成字幕,提高了多模态监督的效率。

Meta AI开源感知编码器视听(PE-AV):为SAM音频和多模态检索提供支持的视听编码器

实时互动网
实时互动网 · 2025-12-23T02:52:47Z

T5Gemma模型再更新,谷歌还在坚持编码器-解码器架构

机器之心
机器之心 · 2025-12-19T03:59:00Z

T5Gemma 2是基于Gemma 3的多模态长上下文编码器-解码器模型,采用绑定词嵌入和合并注意力机制,显著减少参数量。它支持图像与文本处理,具备更大的上下文窗口和多语言能力,适合快速实验和应用。

T5Gemma 2:下一代编码器-解码器模型

The Keyword
The Keyword · 2025-12-18T18:30:00Z
英特尔视频处理库新增 AI 辅助视频编码器功能

英特尔发布了libvpl 2.16版本,新增AI辅助视频编码的实验性API,支持显著性编码和自适应目标使用方案。具体实现细节尚未公布,用户可在GitHub上获取该版本。

英特尔视频处理库新增 AI 辅助视频编码器功能

实时互动网
实时互动网 · 2025-12-18T01:55:31Z
Interspeech 2026 第二届音频编码器能力挑战赛正式启动

国际语音会议Interspeech 2026将于2026年9月在悉尼举行,期间将举办音频编码器能力挑战赛(AECC)。比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型,主办方提供评估系统。参赛者可使用公开数据集,报名截止日期为2026年1月25日。

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

实时互动网
实时互动网 · 2025-12-16T01:55:24Z
可扩展多模态模型服务的编码器解耦

现代大型多模态模型(LMM)在服务时效率低下,因视觉编码器与文本生成阶段共享资源。通过将视觉编码器独立服务化,可以实现流水线执行,消除干扰,提高吞吐量并降低延迟,从而优化资源分配和提升多模态请求处理效率。

可扩展多模态模型服务的编码器解耦

vLLM Blog
vLLM Blog · 2025-12-15T00:00:00Z

超越 VTM-RA!快手双向智能视频编码器BRHVC亮相NeurIPS2025

机器之心
机器之心 · 2025-11-21T04:37:51Z
大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

自编码器在地质勘查中广泛应用,尤其在异常识别方面。深度自编码器(DAE)通过无监督学习和非线性特征提取,有效处理复杂地质数据,识别潜在成矿模式,推动成矿预测的发展。

大数据成矿预测系列(九) | 数据的“自我画像”:自编码器如何实现非监督下的“特征学习”

Seraphineの小窝
Seraphineの小窝 · 2025-11-11T11:12:45Z
GStreamer 1.26.7 发布,改进了对 NVIDIA Jetson AV1 编码器的支持

GStreamer 发布了 1.26.7 版本,增强了对 NVIDIA Jetson AV1 编码器的支持,新增了 rtspsrc 元素的 TCP 模式,提升了 GoPro 视频性能,修复了多个元素的问题,并将 Meson 更新至 1.9.0 版本。

GStreamer 1.26.7 发布,改进了对 NVIDIA Jetson AV1 编码器的支持

实时互动网
实时互动网 · 2025-10-15T02:35:28Z
基于自编码器变换器模型的软件缺陷预测

机器学习模型依赖数据,构建包容性系统需重视代表性数据集的设计。目前新手工具较少,难以促进数据设计实践的学习。我们提出了四种数据设计实践(DDPs)。

基于自编码器变换器模型的软件缺陷预测

Apple Machine Learning Research
Apple Machine Learning Research · 2025-10-15T00:00:00Z
Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

Hugging Face发布了mmBERT,这是一种新型多语言编码器,训练于超过3万亿个标记,涵盖1,833种语言。该模型通过渐进式训练,从60种高资源语言扩展到所有语言,显著提升了多语言理解能力,并在多个评估中超越了早期的多语言编码器,展现了高效性与覆盖率的平衡。

Hugging Face推出mmBERT,一种支持1800多种语言的多语言编码器

InfoQ
InfoQ · 2025-09-29T20:10:00Z
Plex 选择在 Oracle 云基础设施上运行 Bitmovin 的 VOD 编码器

Bitmovin 宣布 Plex 选择其 VOD 编码器在 Oracle 云上支持 TVOD 和 PVOD 服务,该编码器提升视频质量并降低 CDN 和存储成本,Plex 的成本分别降低 23% 和 55%。

Plex 选择在 Oracle 云基础设施上运行 Bitmovin 的 VOD 编码器

实时互动网
实时互动网 · 2025-08-29T02:16:14Z
为什么每个人都在衡量编码器的计算效率

流媒体视频运营团队追求高质量观看体验与成本降低,转码是关键成本因素。选择合适的转码解决方案(如CPU、GPU或ASIC)可优化资本与运营成本。基于ASIC的转码器在功耗、性能和可扩展性方面表现最佳,适合高需求环境。

为什么每个人都在衡量编码器的计算效率

实时互动网
实时互动网 · 2025-08-15T03:46:33Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码