小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
短剧视频字幕位置自动识别:OpenCV + Amazon Nova 2 Lite 混合方案

本文介绍了一种短剧视频字幕位置自动识别方案,结合OpenCV和Amazon Nova 2 Lite模型,在30个测试视频中实现了83%的准确率。该方案通过智能抽帧和裁剪技术,优化了字幕检测,显著减少了人工标注工作量,成本低廉,适合大规模应用。

短剧视频字幕位置自动识别:OpenCV + Amazon Nova 2 Lite 混合方案

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-04-23T09:29:12Z

本文介绍了mediabunny,一个基于WebCodecs API的音视频处理框架,支持视频格式转换、添加水印和剪裁视频等功能。通过示例代码,展示了视频水印合成和剪裁的实现,强调了使用canvas进行图像处理的原理。同时,文章还提到多音频和画面的视频合成方法,并提供了相关的实现代码和演示链接。

借助mediabunny纯JS实现视频水印、剪裁、合成等功能

张鑫旭-鑫空间-鑫生活
张鑫旭-鑫空间-鑫生活 · 2026-04-17T07:22:57Z
APV 编解码器如何将移动视频提升至专业标准

三星电子推出APV编解码器,旨在提升手机视频的色彩准确度和细节保留。APV支持实时处理高达8K分辨率的视频,适用于社交媒体和专业编辑,并已成为全球开放标准,支持Android 16及多种后期制作软件。

APV 编解码器如何将移动视频提升至专业标准

实时互动网
实时互动网 · 2026-04-15T07:13:17Z
WebCodecs 手册:浏览器中的原生视频处理

WebCodecs API 提高了浏览器中的视频处理效率,使开发者能够在无需服务器的情况下创建视频编辑和流媒体应用。它提供低级控制和硬件加速,改善用户体验。许多应用如 Capcut 因使用 WebCodecs 而流量显著增加。本文介绍了视频处理基础、WebCodecs API 及其应用,适合前端开发者入门。

WebCodecs 手册:浏览器中的原生视频处理

freeCodeCamp.org
freeCodeCamp.org · 2026-04-08T20:35:45Z
Synamedia 推出全新实时 AI 解决方案 AI by Quortex

Synamedia将在2026年NAB展会上展示“AI by Quortex”,该技术提供实时AI功能,优化视频处理和分发,降低成本。通过识别关键时刻触发AI处理,提升效率,支持内容理解和简化操作。

Synamedia 推出全新实时 AI 解决方案 AI by Quortex

实时互动网
实时互动网 · 2026-04-08T02:38:49Z

Gemma 4是谷歌DeepMind推出的最新开源AI模型,具备先进的推理和自主工作流能力,支持140多种语言的视频和音频处理,适用于各种硬件。该模型在Apache 2.0许可下发布,旨在增强开发者的灵活性和数据控制。

Gemma 4:逐字节,最强大的开源模型

Google DeepMind Blog
Google DeepMind Blog · 2026-04-02T16:00:49Z
从终端部署您的下一个Mux集成

这篇文章介绍了Mux CLI工具的更新,旨在简化开发者和AI代理的工作流程。新功能包括支持JSON输出、实时Webhook事件流、事件重放和合成Webhook事件,提升了集成效率。开发者可以快速设置视频上传、监控和报告,改善开发体验。总之,Mux CLI为视频处理提供了更清晰、结构化的接口。

从终端部署您的下一个Mux集成

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2026-03-24T16:36:41Z
大规模视频合并与转码

本文介绍了如何利用AWS服务构建高效的视频处理系统,成功在短时间内完成2500部短剧的合并与转码。通过选择Lambda、Batch和Fargate的组合,优化了成本和性能,最终节省了约60%的费用。系统实现了高并发处理和实时监控,展示了云计算在媒体处理中的强大能力。

大规模视频合并与转码

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2026-03-13T02:59:47Z
ffmpeg-over-ip – 远程 FFmpeg,异地处理视频。但是有用吗?

ffmpeg-over-ip 是一款开源工具,支持在远程高性能电脑上处理视频,兼容 Win/mac/Linux。它简化了 GPU 访问,无需复杂设置,便于局域网内进行视频编码和解码。

ffmpeg-over-ip – 远程 FFmpeg,异地处理视频。但是有用吗?

小众软件
小众软件 · 2026-03-12T07:04:35Z
Meta中的FFmpeg:大规模媒体处理

FFmpeg是多媒体处理的行业标准工具,Meta与FFmpeg开发者合作,开发了多线程转码和实时质量指标等功能,以应对处理数十亿媒体文件的挑战,最终提升了视频处理的效率和可靠性。

Meta中的FFmpeg:大规模媒体处理

Engineering at Meta
Engineering at Meta · 2026-03-02T20:00:12Z
FFmpeg + OpenCV:quink_oc_plugin 插件架构设计与实践

本文介绍了quink_oc_plugin插件架构,旨在简化视频处理,将FFmpeg与OpenCV结合。该插件支持零拷贝和GPU加速,适用于复杂的多媒体处理场景,降低了FFmpeg的开发门槛。

FFmpeg + OpenCV:quink_oc_plugin 插件架构设计与实践

实时互动网
实时互动网 · 2026-02-10T03:48:42Z
摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

摩尔线程开源了TorchCodec-MUSA,实现了PyTorch编解码库的硬件适配,支持无缝迁移至国产GPU,提升视频处理效率,简化开发流程,降低使用门槛,推动国产GPU在AI训练中的应用。

摩尔线程开源TorchCodec-MUSA,全功能GPU加速PyTorch多模态训练

实时互动网
实时互动网 · 2026-01-22T06:12:48Z
轻松上手 Rust 编程的练习项目:辅助理解生动有趣 | 开源日报 No.839

《开源人工智能状态》是一本综合指南,探讨开源AI的趋势与实践。Rustlings帮助用户学习Rust编程,Vidgear是高性能视频处理框架,zero123plus可将单图像转为多视角,gpts-works是第三方GPT商店。

轻松上手 Rust 编程的练习项目:辅助理解生动有趣 | 开源日报 No.839

开源服务指南
开源服务指南 · 2026-01-03T07:35:20Z
七大开源OCR模型

本文介绍了七种可本地运行的光学字符识别(OCR)模型,如olmOCR-2、PaddleOCR v5和OCRFlux 3B,能够高效将文档、表格和图形转换为准确的Markdown文本,支持多语言、跨页合并和视频处理,适用于多种文档解析需求。

七大开源OCR模型

KDnuggets
KDnuggets · 2025-12-24T13:00:41Z
使用 @mux/ai 启动持久化视频 AI 工作流

Mux推出了@mux/ai,简化了AI工作流的构建,用户可以轻松获取视频摘要和标签。通过Workflow DevKit,用户可以实现持久化工作流,支持错误处理和重试,提升视频处理的效率和可靠性。

使用 @mux/ai 启动持久化视频 AI 工作流

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2025-12-16T18:41:38Z
视频帧截图(Video2Frame)专业视频抽帧截图工具

视频帧截图(Video2Frame)是一款强大的视频处理工具,支持iOS、iPadOS和macOS,能够高效提取视频帧,兼容多种格式,提供普通和兼容两种处理模式,适用于视频编辑、内容创作等场景,确保用户隐私安全。

视频帧截图(Video2Frame)专业视频抽帧截图工具

陈看川博客
陈看川博客 · 2025-11-19T21:01:20Z
WinForm + FFmpeg 开发的轻量级视频压缩工具

VideoCompress是一款基于FFmpeg的Winform视频处理软件,界面简单易用,具备高效压缩功能,支持多种视频格式,提供智能压缩、自定义参数和批量处理,适合普通用户和专业需求。该软件开源并持续更新,有效解决视频存储和传输问题。

WinForm + FFmpeg 开发的轻量级视频压缩工具

dotNET跨平台
dotNET跨平台 · 2025-10-19T00:02:27Z
B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩

B站多媒体实验室在ICCV MIPI Workshop的细粒度图像质量定位国际挑战赛中,提出多模态训练策略,提升综合指标13.5%,获得第二名。实验室专注于视频质量评价与图像处理的协同,应用GRPO算法优化模型,验证了SFT+GRPO的有效性,推动智能视频处理系统的发展。

B站多模态精细画质分析模型在 ICCV2025 大赛获得佳绩

实时互动网
实时互动网 · 2025-10-17T06:17:02Z
Smartzer如何消除手动视频工作流程,专注于开辟新收入

Smartzer是一家互动购物平台,利用Mux实现视频处理和直播字幕的自动化,成功举办了175,000观众的直播购物活动,提升了用户体验和广告合作机会,带来了可观的收入增长。

Smartzer如何消除手动视频工作流程,专注于开辟新收入

Mux Blog - Video technology and more
Mux Blog - Video technology and more · 2025-10-07T21:14:39Z
Cloudastructure 推出 MotionGi,重新定义视频处理效率

Cloudastructure推出的MotionGi视频处理技术显著降低了带宽和CPU需求,同时提升了视频质量和系统性能。该技术支持更多摄像头,降低部署成本,增强安全性,帮助客户实现更高的可靠性和更快的响应速度。

Cloudastructure 推出 MotionGi,重新定义视频处理效率

实时互动网
实时互动网 · 2025-09-22T09:06:17Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码