小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
芯原推动AV2在下一代视频与流媒体应用中商用落地

芯原股份宣布其VC9800D视频处理IP已支持AV2解码,扩展了视频编解码能力。AV2是新一代视频编码标准,提升了压缩效率,适用于流媒体和实时视频会议。VC9800D支持多种视频格式,具备高性能处理能力,满足客户对高品质视频体验的需求。

芯原推动AV2在下一代视频与流媒体应用中商用落地

实时互动网
实时互动网 · 2026-06-09T02:02:43Z
从任意视角探索场景:3D体积视频技术突破意味着3D流媒体可能很快成为现实

布朗大学研究人员推出了名为PackUV的3D体积视频处理方法,旨在实现可存储、流式传输的逼真3D视频。该技术通过多台摄像机拍摄场景,并利用算法重建三维空间,允许从任意角度观看。研究团队克服了视频文件大小和流媒体传输的挑战,使其与现有视频编解码器兼容,推动3D视频在娱乐和制造业等领域的应用。

从任意视角探索场景:3D体积视频技术突破意味着3D流媒体可能很快成为现实

实时互动网
实时互动网 · 2026-06-03T03:51:48Z
针对视频智能的多模态模型微调

2026年上半年,Mux推出了@mux/ai SDK,作为开源版本,允许用户自定义AI工作流。通过与Baseten集成,用户可以使用LoRA技术对模型进行微调,提升视频智能处理能力。@mux/ai为需要更高定制化的项目提供了更多控制和灵活性。

针对视频智能的多模态模型微调

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2026-05-28T16:22:16Z
一文通透Qwen3-VL——在交错式MRoPE、DeepStack、文本时间戳对齐机制的基础上,先预训练,再后训练(即分别SFT、蒸馏、RL)

Qwen系列模型最新升级为Qwen3-VL,在视觉理解和视频处理方面有显著提升。引入多维旋转位置编码(MRoPE)和DeepStack技术,增强了对复杂场景的推理能力,支持长文档和长视频处理,具备更高的上下文长度和精确的时间定位能力,推动多模态理解的进步。

一文通透Qwen3-VL——在交错式MRoPE、DeepStack、文本时间戳对齐机制的基础上,先预训练,再后训练(即分别SFT、蒸馏、RL)

结构之法 算法之道
结构之法 算法之道 · 2026-05-08T07:57:45Z
短剧视频字幕位置自动识别:OpenCV + Amazon Nova 2 Lite 混合方案

本文介绍了一种短剧视频字幕位置自动识别方案,结合OpenCV和Amazon Nova 2 Lite模型,在30个测试视频中实现了83%的准确率。该方案通过智能抽帧和裁剪技术,优化了字幕检测,显著减少了人工标注工作量,成本低廉,适合大规模应用。

短剧视频字幕位置自动识别:OpenCV + Amazon Nova 2 Lite 混合方案

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-04-23T09:29:12Z

本文介绍了mediabunny,一个基于WebCodecs API的音视频处理框架,支持视频格式转换、添加水印和剪裁视频等功能。通过示例代码,展示了视频水印合成和剪裁的实现,强调了使用canvas进行图像处理的原理。同时,文章还提到多音频和画面的视频合成方法,并提供了相关的实现代码和演示链接。

借助mediabunny纯JS实现视频水印、剪裁、合成等功能

张鑫旭-鑫空间-鑫生活
张鑫旭-鑫空间-鑫生活 · 2026-04-17T07:22:57Z
APV 编解码器如何将移动视频提升至专业标准

三星电子推出APV编解码器,旨在提升手机视频的色彩准确度和细节保留。APV支持实时处理高达8K分辨率的视频,适用于社交媒体和专业编辑,并已成为全球开放标准,支持Android 16及多种后期制作软件。

APV 编解码器如何将移动视频提升至专业标准

实时互动网
实时互动网 · 2026-04-15T07:13:17Z
WebCodecs 手册:浏览器中的原生视频处理

WebCodecs API 提高了浏览器中的视频处理效率,使开发者能够在无需服务器的情况下创建视频编辑和流媒体应用。它提供低级控制和硬件加速,改善用户体验。许多应用如 Capcut 因使用 WebCodecs 而流量显著增加。本文介绍了视频处理基础、WebCodecs API 及其应用,适合前端开发者入门。

WebCodecs 手册:浏览器中的原生视频处理

freeCodeCamp.org
freeCodeCamp.org · 2026-04-08T20:35:45Z
Synamedia 推出全新实时 AI 解决方案 AI by Quortex

Synamedia将在2026年NAB展会上展示“AI by Quortex”,该技术提供实时AI功能,优化视频处理和分发,降低成本。通过识别关键时刻触发AI处理,提升效率,支持内容理解和简化操作。

Synamedia 推出全新实时 AI 解决方案 AI by Quortex

实时互动网
实时互动网 · 2026-04-08T02:38:49Z

Gemma 4是谷歌DeepMind推出的最新开源AI模型,具备先进的推理和自主工作流能力,支持140多种语言的视频和音频处理,适用于各种硬件。该模型在Apache 2.0许可下发布,旨在增强开发者的灵活性和数据控制。

Gemma 4:逐字节,最强大的开源模型

Google DeepMind Blog
Google DeepMind Blog · 2026-04-02T16:00:49Z
从终端部署您的下一个Mux集成

这篇文章介绍了Mux CLI工具的更新,旨在简化开发者和AI代理的工作流程。新功能包括支持JSON输出、实时Webhook事件流、事件重放和合成Webhook事件,提升了集成效率。开发者可以快速设置视频上传、监控和报告,改善开发体验。总之,Mux CLI为视频处理提供了更清晰、结构化的接口。

从终端部署您的下一个Mux集成

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2026-03-24T16:36:41Z
大规模视频合并与转码

本文介绍了如何利用AWS服务构建高效的视频处理系统,成功在短时间内完成2500部短剧的合并与转码。通过选择Lambda、Batch和Fargate的组合,优化了成本和性能,最终节省了约60%的费用。系统实现了高并发处理和实时监控,展示了云计算在媒体处理中的强大能力。

大规模视频合并与转码

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-03-13T02:59:47Z
ffmpeg-over-ip – 远程 FFmpeg,异地处理视频。但是有用吗?

ffmpeg-over-ip 是一款开源工具,支持在远程高性能电脑上处理视频,兼容 Win/mac/Linux。它简化了 GPU 访问,无需复杂设置,便于局域网内进行视频编码和解码。

ffmpeg-over-ip – 远程 FFmpeg,异地处理视频。但是有用吗?

小众软件
小众软件 · 2026-03-12T07:04:35Z
Meta中的FFmpeg:大规模媒体处理

FFmpeg是多媒体处理的行业标准工具,Meta与FFmpeg开发者合作,开发了多线程转码和实时质量指标等功能,以应对处理数十亿媒体文件的挑战,最终提升了视频处理的效率和可靠性。

Meta中的FFmpeg:大规模媒体处理

Engineering at Meta
Engineering at Meta · 2026-03-02T20:00:12Z
FFmpeg + OpenCV:quink_oc_plugin 插件架构设计与实践

本文介绍了quink_oc_plugin插件架构,旨在简化视频处理,将FFmpeg与OpenCV结合。该插件支持零拷贝和GPU加速,适用于复杂的多媒体处理场景,降低了FFmpeg的开发门槛。

FFmpeg + OpenCV:quink_oc_plugin 插件架构设计与实践

实时互动网
实时互动网 · 2026-02-10T03:48:42Z
摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

摩尔线程开源了TorchCodec-MUSA,实现了PyTorch编解码库的硬件适配,支持无缝迁移至国产GPU,提升视频处理效率,简化开发流程,降低使用门槛,推动国产GPU在AI训练中的应用。

摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

实时互动网
实时互动网 · 2026-01-22T06:12:48Z
轻松上手 Rust 编程的练习项目:辅助理解生动有趣 | 开源日报 No.839

《开源人工智能状态》是一本综合指南,探讨开源AI的趋势与实践。Rustlings帮助用户学习Rust编程,Vidgear是高性能视频处理框架,zero123plus可将单图像转为多视角,gpts-works是第三方GPT商店。

轻松上手 Rust 编程的练习项目:辅助理解生动有趣 | 开源日报 No.839

开源服务指南
开源服务指南 · 2026-01-03T07:35:20Z
七大开源OCR模型

本文介绍了七种可本地运行的光学字符识别(OCR)模型,如olmOCR-2、PaddleOCR v5和OCRFlux 3B,能够高效将文档、表格和图形转换为准确的Markdown文本,支持多语言、跨页合并和视频处理,适用于多种文档解析需求。

七大开源OCR模型

KDnuggets
KDnuggets · 2025-12-24T13:00:41Z
使用 @mux/ai 启动持久化视频 AI 工作流

Mux推出了@mux/ai,简化了AI工作流的构建,用户可以轻松获取视频摘要和标签。通过Workflow DevKit,用户可以实现持久化工作流,支持错误处理和重试,提升视频处理的效率和可靠性。

使用 @mux/ai 启动持久化视频 AI 工作流

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2025-12-16T18:41:38Z
视频帧截图(Video2Frame)专业视频抽帧截图工具

视频帧截图(Video2Frame)是一款强大的视频处理工具,支持iOS、iPadOS和macOS,能够高效提取视频帧,兼容多种格式,提供普通和兼容两种处理模式,适用于视频编辑、内容创作等场景,确保用户隐私安全。

视频帧截图(Video2Frame)专业视频抽帧截图工具

陈看川博客
陈看川博客 · 2025-11-19T21:01:20Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码