小红花·文摘

【案例共创】码道小工匠，儿童跳绳智能计数系统开发实战

华为云官方博客 ·

LG新款K歌派对音响采用AI技术去除歌曲人声

The Verge ·

AI TrackMate是一款基于大语言模型的音乐聊天机器人，旨在为独立音乐制作人提供客观反馈。它结合音频分析与音乐知识，帮助提升创作技能和支持创意发展。

AI TrackMate: Finally, Someone Who Can Provide More Feedback for Your Music Than Just 'Sounds Great!'

BriefGPT - AI 论文速递 ·

Veritonic通过高级音频分析帮助创作者和品牌优化视频播客策略

实时互动网 ·

本研究综述了视听深度伪造检测的技术与挑战，强调音频与视觉联合分析的重要性，表明结合这两种模态的方法能显著提高检测准确性，为网络安全和媒体完整性研究提供指导。

Understanding Audiovisual Deepfake Detection: Techniques, Challenges, Human Factors, and Perceptual Insights

BriefGPT - AI 论文速递 ·

作者分享了在TCP1P CTF 2024比赛中解决OSINT挑战的经验。第一个挑战是通过解密文件和分析照片，帮助Jieyab找到Violet，确定公交站名为JPO SMP MUHAMMADIYAH 10 B。第二个挑战是通过社交媒体调查和音频分析，找出使用假账号的真实姓名为Slamet Setiawan Uzumaki。

TCP1P CTF INTERNATIONAL 2024 — OSINT 解题报告

DEV Community ·

在研究者之夜，我展示了一个与教授合作的音频分析项目。该项目使用Python开发，旨在识别特定声音并评估风险。我开发了一个核心库来分析音频特征，并分享了Python学习建议，如线程管理和GIL机制。

研究者之夜：我们的项目！

DEV Community ·

Qwen是一系列大型语言模型，包括基础模型和聊天模型，表现出色。Qwen-Audio是音频语言模型，支持语音聊天和音频分析。Qwen-VL系列提升了多模态人工智能能力。Baichuan 2及其他模型在多个基准测试中表现优异，推动了多语言和多模态研究的发展。

Qwen2 技术报告

BriefGPT - AI 论文速递 ·

本文介绍了多个用于音频和视觉分析的数据集，涵盖古典音乐表演、声音活动检测、动作捕捉和音乐信息检索等领域。研究旨在提升音乐和语言的理解与检索能力，推动相关领域的发展。

跨模态音乐处理的带语义注释的 Mosa 数据集

BriefGPT - AI 论文速递 ·

本文讨论了如何使用AudioContext和MediaElementAudioSourceNode调整媒体元素的播放参数，并介绍了AnalyserNode的功能，包括实时频率和时域分析，以及fftSize的设置对音频流的影响。

WebAudio笔记

时间的朋友 ·

HTML5 音乐可视化

smallyu的博客 ·