小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
零样本文本分类入门

零样本文本分类是一种无需特定任务训练数据即可标记文本的方法。模型通过将标签转化为自然语言陈述,判断输入文本与这些陈述的匹配程度。这种方法适用于快速原型开发和资源有限的任务。使用预训练模型(如facebook/bart-large-mnli)可以有效进行多标签分类和自定义假设模板,从而提高分类准确性,关键在于清晰的标签定义和合理的假设模板。

零样本文本分类入门

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-20T12:00:16Z
突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

美团LongCat团队发布了LongCat-AudioDiT模型,采用全新的端到端文本转语音技术,减少信息损失。该模型在Seed基准测试中表现优异,取得最佳的说话人相似度和可懂度,证明了在波形潜空间生成语音的有效性。LongCat-AudioDiT以简化架构和高保真合成为目标,已开源,期待推动语音生成技术的发展。

突破零样本 TTS 音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

美团技术团队
美团技术团队 · 2026-04-20T00:00:00Z
突破零样本TTS音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

音频生成技术正向端到端生成演进。美团LongCat团队推出LongCat-AudioDiT,直接在波形潜空间进行文本转语音,避免信息损失。该模型在Seed基准测试中表现优异,取得了SOTA的说话人相似度和可懂度,展现出强大的零样本语音克隆能力。

突破零样本TTS音色克隆上限:LongCat-AudioDiT 的声音克隆艺术

实时互动网
实时互动网 · 2026-04-02T01:48:34Z
MPC Sample是我新的最爱便携式打击乐器

Akai的MPC Sample是一款便携式打击乐器,适合初学者。它配备2.4英寸彩屏、内置麦克风和可充电电池,预装数百个样本。尽管功能有限,但其直观操作和良好连接性使其成为音乐制作的理想选择,且在价格和功能上具有独特优势。

MPC Sample是我新的最爱便携式打击乐器

The Verge
The Verge · 2026-03-24T14:00:00Z

本文探讨了五种常用的异常值检测方法在葡萄酒数据集上的表现。实验表明,不同方法的结果一致性较差,且对“异常”的定义各异。作者建议在选择检测方法时,明确目标并结合多种方法,以提高检测的可靠性。同时,异常值不一定要删除,应结合领域知识进行判断。

我们在一个真实数据集上使用了五种异常值检测方法:它们对96%的标记样本意见不一致

KDnuggets
KDnuggets · 2026-03-13T14:00:48Z
电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

本文讨论了电子商务搜索中的稀疏嵌入微调,重点评估了SPLADE模型及其困难负样本挖掘。经过微调的SPLADE模型在nDCG@10指标上比BM25提高了28%,强调了领域特定训练的重要性。文章还分析了稀疏与密集向量的混合搜索效果,以及困难负样本挖掘(ANCE)对模型性能的提升。总体而言,微调显著改善了查询扩展、术语加权和电商词汇的表现。

电子商务搜索中的稀疏嵌入微调 | 第3部分:评估与困难负样本

Qdrant - Vector Database
Qdrant - Vector Database · 2026-03-09T00:00:00Z
Sakana AI推出Doc-to-LoRa和Text-to-LoRa:能够即时理解长上下文并通过零样本自然语言调整LLM的超网络

Sakana AI 提出了两种方法:Text-to-LoRA (T2L) 和 Doc-to-LoRA (D2L),通过轻量级超网络实现大型语言模型的高效定制,显著降低内存和延迟,并支持零样本任务适应和跨模态知识迁移。

Sakana AI推出Doc-to-LoRa和Text-to-LoRa:能够即时理解长上下文并通过零样本自然语言调整LLM的超网络

实时互动网
实时互动网 · 2026-02-28T02:57:08Z
RDT2——基于UMI数据实现零样本且跨本体的泛化:先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)

RDT2是一种新型机器人基础模型,旨在实现跨本体、物体和场景的零样本迁移能力。通过使用UMI数据集和三阶段训练策略,RDT2能够高效处理多样化的真实世界任务,提升机器人在未见物体和场景中的泛化能力。该模型在微调实验中表现优异,尤其在复杂操作和动态任务中,展现出显著的性能提升。

RDT2——基于UMI数据实现零样本且跨本体的泛化:先训练VLM、后训练扩散动作专家、最后将扩散策略蒸馏为一步生成器(挑战叠衣服)

结构之法 算法之道
结构之法 算法之道 · 2026-02-13T14:13:39Z
Ryan Booz:介绍Bluebox Docker:一个活的PostgreSQL样本数据库

Bluebox Docker是一个即开即用的PostgreSQL容器,提供持续更新的样本数据库,适合学习和演示。用户只需一个命令即可启动,支持多版本Postgres,并自动生成测试数据,便于监控。

Ryan Booz:介绍Bluebox Docker:一个活的PostgreSQL样本数据库

Planet PostgreSQL
Planet PostgreSQL · 2026-02-12T20:47:13Z
钉钉北京峰会展示AI落地多行业样本,一批企业集中签约

抱歉,您提供的文本内容过于简短,无法进行有效总结。请提供更详细的文章内容。

钉钉北京峰会展示AI落地多行业样本,一批企业集中签约

机器之心
机器之心 · 2026-02-04T02:58:32Z
交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

腾讯混元团队推出的WorldPlay是一个实时交互的世界模型,解决了生成速度与内存占用之间的平衡。该模型通过双重动作表示法、重构上下文记忆机制和情境强迫蒸馏方法,实现了长期几何一致性,能够以24 FPS生成720p高清流媒体视频,展现出优秀的泛化能力。

交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

HyperAI超神经
HyperAI超神经 · 2026-01-06T13:04:18Z
IEEE TASLP | FPO: 细粒度偏好优化提升零样本TTS鲁棒性

近年来,零样本文本转语音(TTS)系统取得进展,但仍存在局部错误。西工大与喜马拉雅合作提出细粒度偏好优化(FPO),有效修复问题片段,提升语音合成的鲁棒性和数据效率。实验结果显示,FPO在可懂度和自然度上显著优于传统方法。

IEEE TASLP | FPO: 细粒度偏好优化提升零样本TTS鲁棒性

实时互动网
实时互动网 · 2026-01-05T03:19:58Z
交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

腾讯混元团队推出的世界模型WorldPlay,实现了实时交互式世界建模,解决了生成速度与内存占用的平衡问题。该模型采用双重动作表示法、重构上下文记忆机制和情境强迫蒸馏方法,能够以24 FPS生成720p高清流媒体视频,展现出优秀的泛化能力,为具身智能和游戏开发等领域开辟了新前景。

交互式世界建模新方案!腾讯混元发布世界模型WorldPlay,兼顾实时生成与长期几何一致性;5万条样本!Med-Banana-50K支持增删病灶双向编辑

HyperAI超神经
HyperAI超神经 · 2026-01-05T03:06:38Z
OpenAI CLIP:通过文本学习零样本图像识别的模型

CLIP是OpenAI开发的神经网络,通过学习4亿对图像和文本,实现无标注数据的图像分类。它通过匹配图像与文本描述,克服了传统计算机视觉的局限性,具有灵活性和高效性,广泛应用于AI领域。

OpenAI CLIP:通过文本学习零样本图像识别的模型

ByteByteGo Newsletter
ByteByteGo Newsletter · 2025-12-29T16:30:45Z
工业质检新王者 - 多模态大模型零样本缺陷检测

多模态大模型(MLLM)能够同时处理文本和图像等多种信息,推动AI向更通用的方向发展。在工业缺陷检测中,MLLM显著减少样本依赖,实现零样本检测,预计到2026年将迎来应用爆发。

工业质检新王者 - 多模态大模型零样本缺陷检测

gloomyfish
gloomyfish · 2025-12-23T09:25:33Z
【最新技术】多模态零样本工业缺陷检测概述

零样本工业缺陷检测模型是工业AI的前沿研究,解决了传统方法对大量样本的依赖。通过无监督学习和预训练模型(如ResNet、CLIP等),该模型能够根据自然语言描述定位缺陷,灵活应对新类型缺陷。尽管在工业应用中表现出高准确率,但对硬件要求较高,推理速度依赖强大计算资源。预计到2026年,掌握此技术的公司将占据市场主动权。

【最新技术】多模态零样本工业缺陷检测概述

gloomyfish
gloomyfish · 2025-12-18T14:40:44Z
GLM-TTS - 一种可控的、情感表达丰富的零样本文本转语音系统,使用…

GLM-TTS是Zai推出的文本转语音项目,专注于可控的情感和语音风格生成。它采用零样本多奖励强化学习,能够生成特定情感的自然语音,支持情感强度和语速等多维度控制,适用于语音助手和有声书等场景。

GLM-TTS - 一种可控的、情感表达丰富的零样本文本转语音系统,使用…

云原生
云原生 · 2025-12-11T06:14:04Z
卡内基跨学科团队利用随机森林模型,基于406份样本成功捕捉33亿年前生命遗迹

研究团队结合热解气相色谱-质谱与机器学习,成功识别古太古代岩石中的生物分子,突破了传统方法的局限,为早期生命探索开辟新路径。

卡内基跨学科团队利用随机森林模型,基于406份样本成功捕捉33亿年前生命遗迹

HyperAI超神经
HyperAI超神经 · 2025-12-11T05:50:46Z
斯坦福/北大/UCL/UC伯克利联手,利用CNN从81万类星体中精准识别7个罕见透镜样本

爱因斯坦的广义相对论表明,质量会弯曲时空,导致光线偏折。研究团队利用机器学习方法识别出7个高质量的类星体透镜候选体,扩展了样本,为黑洞与星系的共演化研究提供了新途径。

斯坦福/北大/UCL/UC伯克利联手,利用CNN从81万类星体中精准识别7个罕见透镜样本

HyperAI超神经
HyperAI超神经 · 2025-12-04T04:12:45Z

研究表明,在多模态大模型训练中,样本难度比训练范式更为重要。中兴通讯团队首次通过GRPO-only方法,在视觉推理和感知任务中超越传统的SFT+RL范式,提出了PISM和CMAB两种难度量化策略,显著提升了模型性能,验证了难度感知采样的有效性。

精准锁定「硬骨头」:难样本筛选破局SFT依赖,GRPO-only斩获感知推理双最优

量子位
量子位 · 2025-11-28T04:16:50Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码