小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究发布了一个包含100小时语音和视频的多模态中文AVSR数据集Chinese-LiPS,并开发了LiPS-AVSR管道,通过结合唇语阅读和演示信息,提升了语音识别性能约35%。

Chinese-LiPS: A Chinese Audio-Visual Speech Recognition Dataset Incorporating Lip Reading and Presentation Information

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

本研究提出FluentLip,一种基于音素的双阶段音频驱动嘴唇合成方法,旨在提高嘴唇可懂度和视频流畅性。通过结合音素提取和光流一致性损失,显著提升了嘴唇运动的同步性和自然度,实验结果表明其在流畅度和自然性方面优于现有技术。

FluentLip: A Phoneme-Based Two-Stage Method for Audio-Driven Lip Synthesis with Optical Flow Consistency

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-06T00:00:00Z

本研究提出了一种混合量子-经典分层方法HiQ-Lip,用于估计神经网络的全局Lipschitz常数。该方法结合二次无约束优化和图粗化策略,显著提高了计算速度和准确性,效率是现有最佳方法的两倍,展示了小型量子设备的应用潜力。

HiQ-Lip:首个量子-经典分层方法用于 ReLU 网络的全局 Lipschitz 常数估计

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-20T00:00:00Z

HDMI 论坛推出 HDMI 2.2 版,解决音画不同步问题,支持最高 96Gbps 带宽,480Hz 4K、240Hz 8K 和 120Hz 10K 分辨率。新技术 LIP 提升音视频信号对齐,兼容旧版设备。

HDMI论坛正式推出HDMI 2.2版 引入LIP协议彻底解决长期存在的音画不同步问题

蓝点网
蓝点网 · 2025-01-07T01:29:33Z

Sharpen your problem-solving skills the McKinsey way, with our weekly crossword. Each puzzle is created with the McKinsey audience in mind, and includes a subtle (and sometimes not-so-subtle)...

The McKinsey Crossword: Zip Your Lip | No. 212

McKinsey Insights & Publications
McKinsey Insights & Publications · 2024-12-24T00:00:00Z

本研究提出了一种新颖的全端到端口型同步框架LatentSync,基于音频条件的潜在扩散模型,旨在提高时序一致性和口型同步的准确性。

LatentSync: Lip Syncing Based on Audio-Conditioned Latent Diffusion Model

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-12T00:00:00Z

本文提出了一种名为PointTalk的3D高斯方法,旨在解决数字人类领域中基于任意语音音频的对话头合成问题。该方法通过静态3D高斯场与音频同步变形,并引入动态唇部点云,显著提升了合成的高保真度和音频与唇部的同步性能。

PointTalk: Audio-Driven Dynamic Lip Point Cloud for 3D Gaussian-Based Talking Head Synthesis

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-11T00:00:00Z

本文介绍了轻量级智能预处理器LIP,旨在提升文本可读性,解决TTS系统对标点和表情符号的识别问题。研究表明,启用LIP的TTS引擎偏好度达到76.5%。此外,探讨了大型语言模型在自闭症儿童语言治疗中的应用,强调其潜力与伦理考量,并评估了ChatGPT在自闭症诊断中的准确性,显示其在语言特征识别方面的优势,呼吁在临床实践中应用先进AI工具。

TwIPS:基于大型语言模型的简化文本应用,为自闭症用户简化对话细节

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-25T00:00:00Z

本文探讨了深度学习在医学图像处理中的应用,提出了多种提高低剂量图像质量和对比度的方法,如条件自回归视觉模型和无监督密度神经表示。这些技术有效降低了噪声和伪影,提升了图像重建的鲁棒性和准确性。

LIP-CAR:深度学习反问题中的对比剂减少

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-15T00:00:00Z

本论文研究了唇语识别的两种模型:使用自注意力机制的CTC和序列到序列模型。同时,介绍了新的数据集LRS2-BBC,并公开发布。实验结果表明,该模型在有噪音的情况下表现优于以前的相关工作。

LIP-RTVE:西班牙连续口语的音视数据库

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-11-21T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码