小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了一种通过优化输入嵌入(“软提示”)来评估语言模型潜力的新方法。这项技术有助于识别潜在能力并量化复杂模型中的不当行为,具有重要的应用前景。

评估的软提示:测量能力的条件距离

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z

本研究提出Yo'Chameleon模型,采用软提示调整技术,解决大型多模态模型在个性化知识和图像生成方面的不足。结果表明,该方法在少量样本下提升了图像质量,并保持了多模态性能。

YoChameleon: Personalized Visual and Language Generation

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-29T00:00:00Z

本研究提出了一个评估软提示可解释性的理论框架,发现现有方法未能满足可解释性标准,并探索了优化训练提示的新方法,揭示了可解释性与任务性能之间的权衡。

Towards Interpretable Soft Prompts

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-02T00:00:00Z

本研究探讨了大语言模型中的提示压缩方法,以解决长提示带来的内存和推理成本问题。比较了硬提示和软提示的技术,分析其机制,并提出未来的优化方向,表明提示压缩能显著提高模型效率。

Prompt Compression for Large Language Models: A Survey

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z

本研究提出了一种新方法,通过“软提示”嵌入和激活补丁技术提高微调模型的鲁棒性。动态激活组合和基于拒绝采样的自我指导微调方法在控制模型行为和提高生成效率方面表现优越,尤其在数据量较少时。

激活缩放用于引导和解释语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-07T00:00:00Z

本文探讨了文本转图片模型(如DALL-E 2、Stable Diffusion)中提示词选择的重要性,提出了一种评估提示效果的技术,并引入手动标注的数据集以衡量提示在图像生成和检索中的表现。研究展示了通过软提示个性化模型的能力,提升生成图像与用户意图的一致性,并提出新的无提示图像合成框架,表现优于传统方法。

文字胜过千言万语:衡量和理解文本到图像生成中的知觉变异性

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-12T00:00:00Z

本研究提出了一种通过“软提示”优化大型语言模型(LLMs)的方法,以提高其与人类语言处理的相似性。研究表明,指导调优能提升大脑对齐,但对行为对齐的影响有限。同时,提出了对比指令调优(CoIN),增强模型对未知指令的稳健性,顺序指令调整则改善了模型执行多步骤指令的能力。研究还揭示了数据量和模型规模对性能的影响,并强调了人工指导数据的优势。

指令调整能提高 LLMs 的一致性吗?

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-23T00:00:00Z

本文介绍了多种提示调整技术,如Fast Prompt Tuning、统一的Prompt Tuning框架、CP-Tuning和FRPT,旨在提升预训练语言模型的训练效率和性能。研究表明,软提示的迁移性与神经元激活重叠率相关,测试时间提示调整方法能有效提高模型的校准能力和泛化能力。这些技术在文本分类和图像检索等任务中表现优异。

FPT:用于少样本可读性评估的特征提示调整

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-03T00:00:00Z

本文研究了提高大型语言模型性能的方法,包括细调、RAG和软提示等。测试发现,经过细调的模型和RAG方法在回答事件问题方面表现优于未修改版本的GPT 3.5。应用软提示可以显著提高性能。

微调与检索增强生成:面向不那么流行的知识

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-03-03T00:00:00Z

本研究通过插入可学习的嵌入或软提示到模型的输入层,将预训练语言模型调适到特定任务。研究发现,这种方法减少了计算成本和存储开销,同时增强了跨语言传递性能。研究还探索了不同因素对跨语言传递性能的影响。

跨语言迁移的软提示调整:少即是多

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-02-06T00:00:00Z

DePT是一种新的参数高效微调方法,通过将软提示分解为较短的软提示和一对低秩矩阵并使用两个不同的学习率进行优化。在23个自然语言处理和视觉语言任务上的实验表明,DePT在某些情况下优于最先进的参数高效微调方法,包括完全微调基线。此外,DePT在模型规模增大时更加高效,并且适用于少样本学习设置和各种模型架构和规模。

通过低秩重参数化分解的提示调整

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-16T00:00:00Z

DePT是一种新的参数高效微调方法,通过将软提示分解为较短的软提示和一对低秩矩阵并使用两个不同的学习率进行优化。在23个自然语言处理和视觉语言任务上的实验表明,DePT在某些情况下优于最先进的参数高效微调方法,包括完全微调基线。此外,DePT在模型规模增大时更加高效,并且适用于少样本学习设置和各种模型架构和规模。

DePT: 解耦式提示调节

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-14T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码