小红花·文摘

Seedance 2.0上手实测：3大革命性功能，15秒烧掉10块钱到底值不值？

硕鼠的博客站 ·

音视频 iOS 面试题｜音视频面试题集锦 49 期

实时互动网 ·

OpenAI发布了Sora 2，一个类似“抖音”的AI短视频生成平台。该平台支持音视频同步生成，遵循物理定律，用户可以创作和分享内容。新功能“客串”允许用户将自己或朋友的形象植入视频。尽管画质有待提升，但整体效果接近电影级别。

OpenAI突然发布Sora 2：好一个“AI版抖音”！

量子位 ·

OpenAI 发布 Sora 2！AI 视频 GPT-3.5 时刻来了，还有一个 AI 版抖音| 附下载链接

爱范儿 ·

如何利用 SEI 解决音画不同步的问题

实时互动网 ·

电脑控制安卓开源工具 Scrcpy v3.3 升级：支持在虚拟显示器上使用鼠标

小众软件 ·

FFmpeg 播放器入门教程（4）：线程分治

实时互动网 ·

本研究提出了UniSync，一种新方法用于解决音视频同步问题。UniSync通过嵌入相似性评估音视频同步，兼容多种音频和视觉表示，提升自然和AI生成内容的同步质量，超越现有技术。

UniSync: A Unified Framework for Audio-Visual Synchronization

BriefGPT - AI 论文速递 ·

MKVToolNix 是一款用于创建和编辑 MKV 文件的工具，支持合并、分离和音视频同步等功能，兼容多种媒体格式，界面友好，但初学者需了解基本视频编码知识。整体而言，MKVToolNix 是一款实用的编辑工具。

MKVToolnix – 一款MKV 封装工具

老董日志 ·

HDMI 2.2将带宽提升至96Gbps，旨在永久消除音频同步问题

The Verge ·

本研究解决了视频到音频合成中的音视频同步问题，通过构建名为“绘制音频”的模型，采用了多输入指令和掩膜-注意机制，确保生成音频与输入视频内容一致。该模型在大规模数据集上表现出色，达到了先进水平，具有广泛应用潜力。

绘制音频：利用多指令进行视频到音频合成

BriefGPT - AI 论文速递 ·

本研究提出了一种新的语音驱动面部生成方法，能够通过输入语音、面部图像和情感标签来呈现表情。该系统在图像质量、音视频同步和视觉情感表达方面表现出色，经过主观和客观评估证明了其优越性。此外，利用生成的视频进行了人类情感识别实验，结果显示在音频和视觉模态不匹配的情况下，人们对视觉模态的响应更为显著。

CSTalk: 协作监督的语音驱动 3D 情感面部动画生成

BriefGPT - AI 论文速递 ·

本文介绍了Android音视频开发结构中的音视频读取和解码过程，包括使用MediaExtractor类进行音视频读取和使用MediaCodec类进行音视频解码。音视频播放依靠TextureView和AudioTrack等组件，音视频同步通过比较解码出来的帧的时刻戳和独立时刻轴的时刻戳来实现。文章还提到了播放/暂停、获取预览图和播放进度条等功能。