小红花·文摘

OpenAI 在 Realtime API 中发布了三个实时音频模型：GPT-Realtime-2、GPT-Realtime-Translate 和 GPT-Realtime-Whisper

实时互动网 ·

作者分享了使用GitHub Action自动更新运动数据的经历，体验了GPT Plus并充值，购买了录音笔并使用Whisper转录，注册了V2EX社区，解决了GPT API续费问题，并报名了PMP培训班和考试。

最近在做的事：GitHub Action | GPT Plus | whisper | V2EX | GPT API | PMP

了迹奇有没 ·

本文介绍了如何使用Faster-Whisper在本地快速转录音频。首先需将音频转换为16 kHz单声道WAV格式，然后使用Python脚本进行转录。Faster-Whisper比原版Whisper速度更快，适合在CPU和GPU上运行，保护隐私且无需云服务。设置环境时需安装FFmpeg和pydub库，并提供了完整的转录示例代码。

本地Whisper音频转录

KDnuggets ·

使用Amazon SageMaker Hyperpod Cluster部署whisper模型

亚马逊AWS官方博客 ·

GStreamer 1.28.1 发布，新增基于 Whisper 的语音转文本功能，并支持 AV1 有状态 V4L2 解码器

实时互动网 ·

在 Amazon SageMaker 上部署 Fast-Whisper：Async endpoint推理部署实践总结

亚马逊AWS官方博客 ·

WhisperJAV – 专用解决方案：Whisper 在日语场景下该怎么用？

小众软件 ·

4.8K Star!本地语音转文字神器Vibe:基于Whisper离线转录,支持GPU加速+字幕导出

dotNET跨平台 ·

微软发现新型旁路攻击技术Whisper Leak，攻击者可通过监控网络流量推断加密聊天内容，导致隐私风险。研究表明，特定对话会留下可识别的数字指纹，攻击准确率高达98%。主流厂商已采取措施降低风险，用户应避免在不信任的网络上讨论敏感话题，并使用VPN保护隐私。

AI聊天隐私风险：微软披露Whisper Leak旁路攻击技术

FreeBuf网络安全行业门户 ·

研究人员发现了“Whisper Leak”漏洞，攻击者可通过分析加密流量的元数据推断用户与AI聊天机器人的对话主题。这在专制地区尤为危险，可能导致用户遭受迫害。微软和OpenAI已推出修复方案，建议用户在公共网络上避免讨论敏感话题。

新型Whisper Leak工具包可窃取加密流量中AI Agent的用户提示

FreeBuf网络安全行业门户 ·

OLMoASR 是什么？它与 OpenAI 的语音识别 Whisper 相比如何？

实时互动网 ·

FFmpeg 8.0 发布，包含 OpenAI Whisper Filter 和多项 Vulkan 视频改进

实时互动网 ·

本实验搭建了一个基于云主机和Whisper语音识别系统的平台，结合云计算与深度学习技术，帮助开发者优化模型训练和进行语音识别处理，掌握数据预处理和模型训练等关键步骤。适合企业、开发者和学生，预计时长120分钟。

基于开发者空间 Notebook 进行 LoRA 微调 Whisper_base 实现语音识别

华为云官方博客 ·

At Interspeech 2025, Bloomberg's AI engineers explore how they adapted OpenAI's Whisper system into a true streaming automatic speech recognition (ASR) model that delivers real-time CPU...