小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
零样本文本分类入门

零样本文本分类是一种无需特定任务训练数据即可标记文本的方法。模型通过将标签转化为自然语言陈述,判断输入文本与这些陈述的匹配程度。这种方法适用于快速原型开发和资源有限的任务。使用预训练模型(如facebook/bart-large-mnli)可以有效进行多标签分类和自定义假设模板,从而提高分类准确性,关键在于清晰的标签定义和合理的假设模板。

零样本文本分类入门

MachineLearningMastery.com
MachineLearningMastery.com · 2026-04-20T12:00:16Z
天下苦「调参」久矣!MIT师生推出全新RandOpt算法

MIT师生提出RandOpt算法,通过随机扰动参数简化预训练模型的调参过程,能够找到“专家”,效果与传统方法相当。研究表明,模型越大,随机改动的效果越明显,且无需复杂训练。此方法节省时间和算力,但依赖优质的预训练数据。

天下苦「调参」久矣!MIT师生推出全新RandOpt算法

量子位
量子位 · 2026-03-16T07:12:20Z
[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

P5是一个统一的推荐系统框架,通过个性化提示和预训练模型提升推荐任务的泛化能力。它将用户-物品交互数据转化为自然语言序列,支持多种推荐任务,实验结果显示P5在多个基准测试中表现优异,具备零样本泛化能力。

[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-20T00:00:00Z
【最新技术】多模态零样本工业缺陷检测概述

零样本工业缺陷检测模型是工业AI的前沿研究,解决了传统方法对大量样本的依赖。通过无监督学习和预训练模型(如ResNet、CLIP等),该模型能够根据自然语言描述定位缺陷,灵活应对新类型缺陷。尽管在工业应用中表现出高准确率,但对硬件要求较高,推理速度依赖强大计算资源。预计到2026年,掌握此技术的公司将占据市场主动权。

【最新技术】多模态零样本工业缺陷检测概述

gloomyfish
gloomyfish · 2025-12-18T14:40:44Z
Interspeech 2026 第二届音频编码器能力挑战赛正式启动

国际语音会议Interspeech 2026将于2026年9月在悉尼举行,期间将举办音频编码器能力挑战赛(AECC)。比赛聚焦音频编码器在复杂场景下的表现,参赛者需提交预训练模型,主办方提供评估系统。参赛者可使用公开数据集,报名截止日期为2026年1月25日。

Interspeech 2026 第二届音频编码器能力挑战赛正式启动

实时互动网
实时互动网 · 2025-12-16T01:55:24Z

ML.NET 可通过文本分类和命名实体识别(NER)提取人名和地名。实现步骤包括安装必要的包、准备预训练模型、定义数据结构、构建 ML 管道并进行预测。尽管 ML.NET 在 NER 生态中不如 Python 库丰富,但适合于已有 .NET 技术栈的轻量集成场景。

ML.NET实现人名、地名的提取

dotNET跨平台
dotNET跨平台 · 2025-12-15T23:50:43Z
TADA:一种改进的无训练增强动态扩散采样方法

本文介绍了一种新的扩散采样方法,其速度比现有最优解快186%。该方法无需训练,利用普通微分方程求解器,通过高维初始噪声生成更详细的样本,并控制细节水平。研究表明,该方法在多个预训练扩散模型上表现优异。

TADA:一种改进的无训练增强动态扩散采样方法

Apple Machine Learning Research
Apple Machine Learning Research · 2025-09-22T00:00:00Z

这篇博客推荐书籍《大规模语言模型:从理论到实践》,认为其为中文领域较为系统的预训练模型学习资料,内容更新及时,适合跳读,帮助读者发现知识盲点。

[书评] 推荐《大规模语言模型:从理论到实践》

桑弧蓬矢射四方
桑弧蓬矢射四方 · 2025-08-15T20:54:00Z
音调重音检测提升了预训练自动语音识别的性能

本文介绍了一种联合自动语音识别(ASR)和音调重音检测模型,显著提升了ASR系统的性能。音调重音检测模块使F1-score提高41%,并在LibriSpeech数据集上将错误率降低28.3%。研究强调了扩展预训练语音模型以保留重要韵律线索的必要性。

音调重音检测提升了预训练自动语音识别的性能

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-15T00:00:00Z
最优语料感知训练用于神经机器翻译

本文介绍了最优语料感知训练(OCAT),该方法通过微调预训练模型提升模型准确性。在翻译任务中,OCAT相较于传统训练提高了3.6和1.8的chrF分数,且具有轻量、不易过拟合和强适应性等优点。

最优语料感知训练用于神经机器翻译

Apple Machine Learning Research
Apple Machine Learning Research · 2025-08-15T00:00:00Z
大语言模型微调

微调是深度学习中的迁移学习方法,利用预训练模型适应新任务。根据任务差异,微调可分为全参数和部分参数微调;在资源有限时,部分参数微调能提高性能。微调还可分为监督与无监督微调,以及指令与对齐微调。参数高效微调方法如Adapter Tuning和LoRA,通过减少更新参数量降低计算成本。

大语言模型微调

范叶亮的博客
范叶亮的博客 · 2025-08-09T00:00:00Z
生成式AI:自学路线图

本文为开发者和数据从业者提供生成式AI系统的实用指南,涵盖从基础模型到生产部署的各个方面,强调预训练模型和概率输出在内容创作中的应用。文章还介绍了Python编程、机器学习概念及大型语言模型的实践项目,以提升技能和展示能力。

生成式AI:自学路线图

KDnuggets
KDnuggets · 2025-07-11T12:00:46Z
大模型从零到一:LLM 原理与实践指南 | 开源日报 No.662

happy-llm 是一个中文教程项目,介绍大语言模型的原理与实践,涵盖 Transformer 架构、预训练模型及 LLaMA2 的搭建与训练,适合有编程基础的 NLP 爱好者。

大模型从零到一:LLM 原理与实践指南 | 开源日报 No.662

开源服务指南
开源服务指南 · 2025-07-11T07:35:34Z

李飞飞团队提出了一种名为“嫁接”的新方法,通过修改预训练模型组件,节省计算资源并验证新架构设计。研究表明,使用不到2%的预训练算力仍能保持模型性能,并提升生成速度,适合资源有限的场景。

李飞飞团队提出架构设计新思路!无需从头训练,直接“嫁接”预训练模型关键组件

量子位
量子位 · 2025-06-20T06:05:40Z

本研究探讨了预训练模型在人工智能创新中的应用,分析了HCI研究者的案例,提出了创新机会、能力分类和新兴交互设计模式,为有效应用提供指导,强调理解这些模型对推动AI创新的重要性。

Exploring Innovative Opportunities of Pre-trained Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本研究提出了一种变分前缀调优(VPT)方法,旨在解决代码摘要生成中对多样性和替代选项的忽视。该方法基于条件变分自编码器框架,增强了预训练模型生成多样且精确摘要的能力,使用户能够选择最合适的摘要,并在参数效率上优于传统方法。

Variational Prefix Tuning for Diverse and Accurate Code Summarization

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-14T00:00:00Z
模型调用:Amazon Bedrock

Amazon Bedrock是AWS服务,简化生成AI应用的构建与扩展。用户可通过Python调用多种预训练模型,便于与其他AWS服务集成。使用时需安装AWS SDK,配置凭证,并选择基础模型,适合智能应用开发。

模型调用:Amazon Bedrock

DEV Community
DEV Community · 2025-05-12T18:42:42Z
NVIDIA AI 推出 Audio-SDS:基于扩散的统一框架,无需专门数据集即可实现提示引导音频合成和源分离

音频扩散模型已实现高质量音频合成,但参数优化不足。研究者提出Audio-SDS方法,结合预训练模型,优化音频表示,支持FM合成和源分离等任务,提升合成效果与文本提示的一致性,展示了数据蒸馏在音频领域的潜力。

NVIDIA AI 推出 Audio-SDS:基于扩散的统一框架,无需专门数据集即可实现提示引导音频合成和源分离

实时互动网
实时互动网 · 2025-05-12T08:50:32Z
什么是人工智能中的微调?

微调是将预训练模型(如GPT和BERT)适应特定任务或数据集的过程。通过在小型特定数据集上继续训练,微调调整模型权重,使其在特定领域表现更佳。相比从头训练,微调更高效,节省资源和时间,广泛应用于聊天机器人、图像生成和欺诈检测等领域。

什么是人工智能中的微调?

DEV Community
DEV Community · 2025-05-06T03:27:24Z

本研究提出了人工行为智能(ABI)技术框架,旨在理解和预测人类行为。通过预训练大模型和多模态集成模型,显著提高了行为识别的准确性与可解释性,并分析了实际应用中的挑战,为复杂行为推断提供新思路。

Artificial Behavior Intelligence: Technology, Challenges, and Future Directions

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-06T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码