小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
IEEE TASLP | FPO: 细粒度偏好优化提升零样本TTS鲁棒性

近年来,零样本文本转语音(TTS)系统取得进展,但仍存在局部错误。西工大与喜马拉雅合作提出细粒度偏好优化(FPO),有效修复问题片段,提升语音合成的鲁棒性和数据效率。实验结果显示,FPO在可懂度和自然度上显著优于传统方法。

IEEE TASLP | FPO: 细粒度偏好优化提升零样本TTS鲁棒性

实时互动网
实时互动网 · 2026-01-05T03:19:58Z
IndexTTS2:用极致表现力颠覆听觉体验

IndexTTS2是B站语音团队推出的新一代语音合成模型,优化了情感表达和时长控制。该模型通过“时间编码”机制解决了传统模型的时长控制问题,实现了音色与情感的解耦,并支持基于文本的情感调节。IndexTTS2在多项测试中表现优异,推动了零样本语音合成技术的实用化。

IndexTTS2:用极致表现力颠覆听觉体验

实时互动网
实时互动网 · 2025-07-11T06:57:49Z

本研究提出了PDDLego+框架,旨在解决部分可观察环境中的规划问题,实现零样本迭代形式化和规划,展现出优越的性能和鲁棒性。

零样本迭代化形式化和规划在部分可观察环境中的应用

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究提出了一种名为MultiActor-Audiobook的零样本有声书生成方法,能够自动生成具有一致性和表现力的语调与情感,无需额外训练,从而提升有声书的情感表现力。

Multi-Actor Audiobook: Zero-Shot Audiobook Generation Based on Multiple Speakers

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-19T00:00:00Z

本研究探讨了大型语言模型(LLMs)在社交媒体数据中识别和注释人权侵犯的能力。通过比较不同LLMs在零样本和少样本条件下的表现,揭示了它们在处理复杂文本时的错误模式及其在多语言背景下的适用性和局限性。

Comparing the Text Annotation Capabilities of Large Language Models: A Study on Human Rights Violations in Social Media Data

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-15T00:00:00Z

本研究提出MetaUAS,一种基于单一提示的元学习方法,旨在解决零样本和少样本视觉异常分割问题。MetaUAS通过将异常分割与变化分割统一,仅需一张正常图像即可精准分割未见的视觉异常,显著提升分割性能,无需依赖语言模型和特定数据集。

MetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z

本研究提出了一种文本语义增强(TSA)方法,旨在解决文本属性图中的少样本和零样本节点分类问题。通过引入积极和消极语义匹配技术,TSA显著提高了分类准确率,实验结果表明其在多个数据集上超越了现有基线,准确度提升超过5%。

Research on Few-Shot and Zero-Shot Node Classification Using Text Semantics - Based on Text-Attributed Graphs

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-13T00:00:00Z

苏黎世大学等研究团队提出的vesselFM模型专为3D血管分割设计,具备零样本、单样本和少样本场景下的优越分割能力。该模型在大规模数据集上训练,能有效识别血管结构,推动心血管疾病的诊断与医学图像处理的发展。

性能远超SAM系模型,苏黎世大学等开发通用3D血管分割基础模型,入选CVPR 2025

HyperAI超神经
HyperAI超神经 · 2025-05-08T03:02:00Z

本研究提出了一种后验与多样性协同的任务采样方法(PDTS),旨在解决顺序决策中的任务稳健适应问题,增强零样本和少样本的适应能力,加速学习过程。

快速且稳健:在随机环境中结合后验与多样性的任务采样方法用于自适应决策者

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-27T00:00:00Z

本研究提出了一种基于扩散轨迹交集的无模型、零样本、免训练的文本到视频生成方法。该方法通过一致的帧内容生成和控制帧转换时机,显著提升了视频生成的时间一致性和视觉逼真度,实证分析显示用户满意度和量化指标均优于现有方法。

利用扩散轨迹交集的模型无关、零样本、免训练的文本到视频生成方法

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-09T00:00:00Z

本研究提出了ConsDreamer框架,解决了零样本文本到3D生成中的视图偏差问题。通过改进得分蒸馏过程,提升了多视图渲染的一致性,超越了现有方法的视觉质量和一致性。

ConsDreamer:推动零样本文本到3D生成的多视图一致性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-03T00:00:00Z

本研究探讨了多模态大型语言模型在深度伪造图像检测中的潜力,发现其在零样本情况下表现优于传统方法,显示了未来多模态推理整合的可能性。

Can Multimodal (Reasoning) Large Language Models Serve as Deepfake Detectors?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-25T00:00:00Z

本文提出了一种新的零样本无监督生物医学图像分割方法——注意力扩散零样本无监督系统(ADZUS)。该方法利用预训练的扩散模型,实现无需注释的医学图像分割,实验结果表明其在多种医学影像数据集上表现优异,具有广泛的应用潜力。

Self-Attention Diffusion Models for Zero-Shot Biomedical Image Segmentation: Unlocking New Frontiers in Medical Imaging

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-23T00:00:00Z

本研究提出FreeGrasp方法,利用视觉-语言模型理解人类指令与物体关系,有效解决机器人抓取问题。实验结果显示该方法在零样本设置下表现优异,具备应用潜力。

Robot Reasoning and Grasping Based on Free-Form Language

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-17T00:00:00Z

本研究提出了一种新的零样本人机协调方法,解决了未知环境中的泛化能力问题。通过改进效用函数和合作玩家采样策略,显著提升了自我代理与人类的协调性能,实验结果优于其他基线模型。

Automatic Curriculum Design for Zero-Shot Human-AI Coordination

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-10T00:00:00Z

本研究提出SeqFusion框架,通过序列融合多种预训练模型,实现零样本时间序列预测。该方法根据目标时间序列特征选择最适合的模型,实验结果表明其预测准确性与先进方法相当。

SeqFusion: Sequential Fusion of Pre-Trained Models for Zero-Shot Time-Series Forecasting

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-04T00:00:00Z

本研究提出了一种零样本概念瓶颈模型(Z-CBMs),旨在解决传统概念瓶颈模型对大量数据和资源的依赖问题。Z-CBMs无需训练神经网络即可进行概念和标签预测,利用大型概念库进行检索和回归。实验结果表明,该模型具有可解释性和干预性,展现出重要的应用潜力。

Zero-shot Concept Bottleneck Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-13T00:00:00Z

本研究提出了一种基于大型语言模型的零样本决策树构建算法,解决了传统方法对标记数据的依赖。该算法利用预训练知识进行属性离散化和概率计算,能够在数据稀缺的情况下构建透明且可解释的模型。

通过大型语言模型构建零样本决策树

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-27T00:00:00Z

本研究提出GLiREL模型,旨在提高零样本关系分类的效率和准确性。该模型通过一次前向传播预测多个实体关系标签,并在FewRel和WikiZSL基准测试中表现优异。

GLiREL -- A General Model for Zero-Shot Relation Extraction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-06T00:00:00Z

本研究提出了一种深度适应任何相机(DAC)框架,旨在解决鱼眼和360度相机的深度估计问题。DAC通过统一图像表示,提高了多种视场相机的准确性,实现了零样本度量的深度估计。

Depth Adaptation for Any Camera: Zero-Shot Metric Depth Estimation Based on Any Camera

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-05T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码