小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
FFmpeg 获得对 AHX、ADPCM Silicon Graphics N64 解码器的支持

FFmpeg 项目通过手写汇编语言提升性能,并新增对90年代末 AHX 音频文件的支持,同时为 Nintendo 64 添加了 ADPCM 解码器,支持多种其他格式。

FFmpeg 获得对 AHX、ADPCM Silicon Graphics N64 解码器的支持

实时互动网
实时互动网 · 2025-09-24T02:00:54Z
Gemini应用终于支持音频文件

谷歌在周一对Gemini产品进行了三项重要更新:Gemini应用现支持音频文件,免费用户音频限制为10分钟,付费用户可上传最长三小时;搜索功能新增印地语、印尼语、日语、韩语和巴西葡萄牙语;NotebookLM更新报告样式,支持80多种语言,用户可自定义报告格式和风格。

Gemini应用终于支持音频文件

The Verge
The Verge · 2025-09-08T19:14:28Z
探索 FFmpeg Basics 音视频技术(21): 批处理文件

本文介绍了如何使用FFmpeg批处理文件进行音视频处理,重点讲解了其优点和基本命令。通过示例,展示了创建音频文件、格式转换和生成特定音调的方法,适合音视频技术初学者。

探索 FFmpeg Basics 音视频技术(21): 批处理文件

实时互动网
实时互动网 · 2025-07-11T02:47:49Z
你能将图像作为音频文件分享吗?可以——这是它的工作原理

慢扫描电视(SSTV)是一种将图像转换为音频音调的技术,自1950年代以来被广泛应用于业余无线电、NASA和国际空间站。它通过逐行扫描图像,将每个像素的亮度或颜色转化为特定频率,生成音频文件,适合无网络环境的爱好者和复古技术爱好者。

你能将图像作为音频文件分享吗?可以——这是它的工作原理

DEV Community
DEV Community · 2025-05-24T18:00:36Z
使用 Cloudflare Workers 合并音频文件

Hacker News 中文播客最近改为双人对话形式,需要拼接音频文件。由于 Cloudflare Worker Runtime 的限制,使用浏览器和 FFMpeg 的 WASM 版本合并音频,代码通过 Worker 调用浏览器合成音频并返回 Blob。

使用 Cloudflare Workers 合并音频文件

吃面条么
吃面条么 · 2025-04-19T11:09:12Z
构建一个小型转录工具

我推出了一款本地转录应用,利用Faster-Whisper和Flask将音频文件快速准确地转录为文本,支持录制和上传音频,并提供时间戳分段的文本,旨在提高效率并确保数据隐私。

构建一个小型转录工具

DEV Community
DEV Community · 2025-03-21T20:31:42Z

MetatOGGer是一款功能强大的标签管理软件,支持多种音频格式,具备批量编辑标签、自动获取信息、文件分类和删除不良标签等功能,界面友好,适合音乐收藏管理。

Metatogger – 一款音频文件标签编辑器

老董日志
老董日志 · 2025-02-03T09:46:09Z
TDoC '24 第六天:使用Flask为Vocalshift构建网页界面

在TDoC 2024的第六部分中,我们学习了如何使用Flask框架创建网页界面,支持用户输入文本、上传音频文件和下载处理结果。Flask是轻量级的Python网页框架,适合小型项目。文章涵盖了Flask的基本概念、代码分析及构建第一个Flask应用的步骤,包括用户输入处理和文件下载功能。

TDoC '24 第六天:使用Flask为Vocalshift构建网页界面

DEV Community
DEV Community · 2024-12-22T12:24:15Z

本文介绍了如何使用ffmpeg的loudnorm过滤器进行音频响度归一化,以解决不同歌曲音量不一致的问题。作者分享了改进后的脚本,强调了测量与调整的分步过程,以及音频文件处理时的参数选择和编码问题。

使用 ffmpeg 对音频文件进行响度归一化

依云's Blog
依云's Blog · 2024-12-11T03:43:45Z
SynthID 隐形水印抢先体验!让 AI 生成内容更可控;超大规模音频字幕数据集已上线,含 600 万个音频文件...

在AI生成内容日益普及的背景下,Google DeepMind推出了SynthID-Text技术,通过优化Token概率分数嵌入水印,提升文本生成的检测效率和准确性。这项技术为AI内容监管提供了创新解决方案,确保文本质量不受影响。

SynthID 隐形水印抢先体验!让 AI 生成内容更可控;超大规模音频字幕数据集已上线,含 600 万个音频文件...

HyperAI超神经
HyperAI超神经 · 2024-11-22T03:00:42Z
在React中以两种方式下载Base64音频文件

本文探讨了两种下载Base64格式音频文件的方法:直接使用Base64字符串和Blob方法。前者适合小文件,简单直接;后者适合大文件,灵活性更高。选择方法时需考虑文件大小和具体需求。

在React中以两种方式下载Base64音频文件

DEV Community
DEV Community · 2024-11-16T11:21:42Z

本文介绍了如何下载Google Meet会议录像的方法,包括之前的下载方法和当前可行的下载方法。通过浏览器的开发者工具分别下载视频和音频文件,然后使用ffmpeg合并为一个完整的视频文件。提供了使用ffmpeg合并文件的命令。

如何下载设置为仅查看模式的 Google Meet 会议录像

DEV Community
DEV Community · 2024-09-17T17:40:22Z
M4A 格式是什么?M4A 、MP3 和 WAV 的对比

M4A是由苹果开发的音频文件格式,可存储各种类型的音频内容,包括歌曲、有声读物和播客。M4A文件使用MPEG-4容器格式,并使用Apple Lossless Audio Codec(ALAC)或Advanced Audio Coding(AAC)编码。M4A文件常用于从iTunes Store下载音频文件。它们比MP3文件具有更好的音质,但支持程度不如广泛。WAV文件则是无损的、高质量的音频文件。在选择M4A和WAV之间时,考虑文件大小和与设备和软件的兼容性等因素。

M4A 格式是什么?M4A 、MP3 和 WAV 的对比

实时互动网
实时互动网 · 2024-09-11T06:45:00Z
TextToSpeech – 在 Windows 上朗读任意选中的文本,并保存为音频文件

TextToSpeech是一款Windows工具,可以朗读任意选中的文本并保存为音频文件。使用快捷键Alt + S开始朗读,再按一次暂停/恢复朗读,连按两次停止朗读,连按三次保存文本为音频文件。

TextToSpeech – 在 Windows 上朗读任意选中的文本,并保存为音频文件

小众软件
小众软件 · 2024-06-12T07:51:54Z
PowerToys v0.80.0 发布,速览新增 WebP/WebM 格式支持,现在也可以预览音频文件了

PowerToys v0.80.0版本专注于稳定性、改进和新功能。当前预览支持WebP/WebM格式和音频预览。v0.80.0版本的新功能是包含了Microsoft.PowerToys.Configure DSC资源,允许使用Winget配置PowerToys。Peek现在支持预览WebP/WebM图像和音频。建议启用Peek功能。PowerToys包括各种功能,如Always on Top、Wake on Shake、Color Picker等。

PowerToys v0.80.0 发布,速览新增 WebP/WebM 格式支持,现在也可以预览音频文件了

小众软件
小众软件 · 2024-04-06T07:31:38Z
如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件

作者尝试了Google Cloud的Text-to-Speech AI服务,发现可以保存试用语音。然而,由于Azure的语音服务更丰富,作者可能会选择Azure来解决配音问题。

如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件

小众软件
小众软件 · 2023-11-29T05:17:03Z

目录 0. 常用命令说明 1. 倍速播放 1.1 视频画面倍速播放 1.2 音频倍速播放 1.3 视频画面和音频倍速播放 2. 视频片段裁剪 2.1 获取视频的分辨率 2.2 截取指定时长的视频片段 2.3 裁剪视频画面尺寸 3. 视频导出图片 4. 从图片集创建GIF文件 5. 提取视频文件的音频 6. 把音频和画面合并为新的视频 7. 下载m3u8文件为.ts文件 8....

使用ffmpeg对视频和音频文件进行处理

晨曦的博客
晨曦的博客 · 2022-12-30T14:59:00Z

Ultimate Vocal Remover GUI 是一款使用了先进的音源分离模型,以去除音频文件中人声的软件,支持 Windows,也能工作在 macOS 与 Linux 上(可能有部分功能缺失)

Ultimate Vocal Remover GUI – 去除音频文件中的人声,高达 3.5GB 模型的开源人声分离软件

小众软件
小众软件 · 2022-08-03T09:10:06Z

接上篇 SDL 播放 PCM 音频文件,已经实现了 推 的模式去播放,接下来看看 拉 的模式如何实现。

【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件(下)

多媒体开发札记
多媒体开发札记 · 2020-03-22T10:38:09Z

接上篇 SDL 播放 PCM 音频文件,已经实现了 推 的模式去播放,接下来看看 拉 的模式如何实现。

【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件(下)

多媒体开发札记
多媒体开发札记 · 2020-03-22T10:38:09Z
  • <<
  • <
  • 1 (current)
  • 2
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码