BriefGPT - AI 论文速递 ·

基于实时MRI的发音运动合成语音：MRI2Speech

📝

内容提要

本研究解决了以实时MRI为基础的语音合成模型依赖于嘈杂真实语音的问题，导致语音可懂性差。论文提出了一种新方法，适应多模态自监督AV-HuBERT模型进行文本预测，并结合新的基于流的时长预测器，能够在不同的发音者中合成对齐语音。实验结果显示，该方法在USC-TIMIT MRI语料库上实现了15.18%的字错误率，显著优于现有最先进的技术。

🏷️

继续阅读

XMOS推出搭载先进AI语音处理的VocalFusion XVF3620
XMOS 发布了新一代语音处理器 VocalFusion XVF3620，它将 AI 降噪技术与完整的片上语音处理流程相结合，即使在嘈杂、混响和动态环境中...
RoboTTT——面向机器人策略的上下文扩展：将TTT集成至VLA中以推理时建立记忆信息，从而将视觉-运动上下文扩展到 8K 个时间步
摘要：本文提出RoboTTT方法，通过将测试时训练（TTT）机制整合到机器人基础模型中，实现了8K时间步的长视觉-运动上下文建模。该方法采用快速权重机制，...
AI驱动的CLO zFab面料测量套件开放全球供应
（全球TMT 2026年07月22日讯）CLO虚拟时尚宣布，AI驱动的面料数字化解决方案CLO zFab面料测 […]
AI 圈今天最大的瓜：GPT-6 越狱攻击，被 GLM 5.2 揪出了
「GPT-6」为了考试作弊，黑进了别人的服务器#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多精彩内容第一时间为您奉上。
IBM与亚湾超算将联手推出一体化AI平台
(全球TMT 2026年07月22日讯)IBM与鸿海科技集团旗下的亚湾超算（Visionbay.ai）在新加坡 […]
滤镜背后的色彩科学：LUT 是什么？
从风格滤镜，到电影中的专业调色，聊聊 LUT 所代表的色彩规则。查看全文

内容提要

标签

继续阅读