小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
微调与RAG:理解个性化AI聊天机器人的策略

Fine-Tuning和RAG是提高聊天机器人准确性和效率的两种策略。Fine-Tuning通过调整模型权重学习新信息,但更新困难;RAG结合信息检索和文本生成,能够动态获取最新数据,适合实时更新的应用。

微调与RAG:理解个性化AI聊天机器人的策略

DEV Community
DEV Community · 2025-04-03T20:53:38Z

本研究提出FedPIA框架,旨在医疗等隐私环境中有效微调大型视觉-语言模型。通过适配器的置换和整合,优化联邦学习与参数高效微调的结合,显著提升模型在多模态任务中的表现,超越现有基准方法。

FedPIA: Permuting and Integrating Adapters Using Wasserstein Barycenters for Finetuning Foundation Models in Multi-Modal Federated Learning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-19T00:00:00Z

本研究提出了一种新颖的层微调方案,旨在提高资源受限设备上联邦学习中大型语言模型的效率。该方案在计算和内存约束下优于现有方法,并在有限通信条件下的准确度与LoRA相当,显著提升了训练准确性。

Efficient Federated Finetuning of Tiny Transformers on Resource-Constrained Devices

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-12T00:00:00Z
示例训练图像数据集、训练模型、网格和完整训练配置、json文件等

本文比较了Fine-Tuning和LoRA训练方法,提供了模型训练指南和数据集。模型用于教育和研究,支持多种图像生成。LoRA在生成风格化图像时表现优异,但可能导致过拟合;而Fine-Tuning效果更佳。

示例训练图像数据集、训练模型、网格和完整训练配置、json文件等

DEV Community
DEV Community · 2024-11-02T21:24:34Z
对Flux-dev-de-distill、PixelWave v03和Verus Vision模型的Fine-Tuning和DreamBooth训练进行了深入实验

本文总结了对Flux-dev-de-distill、PixelWave v03和Verus Vision模型的Fine-Tuning和DreamBooth训练实验,使用了28张个人和28张道恩·强森的高质量图片。结果显示,Kohya GUI可用于Fine-Tuning,PixelWave v03不适合现实训练,而Flux-dev-de-distill和Verus Vision表现相近。后续将研究SD 3.5模型的最佳训练参数,并解决模型中的混合和类信息覆盖问题。

对Flux-dev-de-distill、PixelWave v03和Verus Vision模型的Fine-Tuning和DreamBooth训练进行了深入实验

DEV Community
DEV Community · 2024-10-31T15:17:18Z

本研究提出FiRST算法,旨在降低自回归大型语言模型在资源受限环境中的推理延迟。该算法通过自适应层选择和任务导向的微调,提高了部署效率和特定任务的准确性。

FiRST: Finetuning Router-Selective Transformers for Input-Adaptive Latency Reduction

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-16T00:00:00Z
玩转 Gemma 2,模型的部署与 Fine-Tuning

Google发布了开放模型Gemma 2,提供9B和27B两种参数规模的选择,支持8192 tokens的上下文长度。用户可以在Hugging Face和Kaggle上免费获取模型权重,并通过多种主流框架进行模型部署。Gemma 2还支持模型的fine-tuning,与主流训练框架完全兼容。Google Cloud提供高级解决方案,帮助用户大规模、自动化地训练开放模型。

玩转 Gemma 2,模型的部署与 Fine-Tuning

实时互动网
实时互动网 · 2024-07-25T02:22:14Z

GPT-4o mini 已成为大型模型领域的顶级表现者,以更低的成本匹敌完整版。OpenAI 正逐步允许对 GPT-4o mini 进行微调,并在 9 月 23 日之前每天提供 200 万个免费训练代币。在 lmsys 排名中,GPT-4o mini 与完整版并列第一,仅落后 7 分。GPT-4o mini 的发布促使其他公司开发更小的模型。

GPT-4o mini登顶大模型竞技场,奥特曼:两个月内微调免费

量子位
量子位 · 2024-07-24T07:35:50Z

本研究通过fine-tuning基础模型,证明其在医学影像领域的优越性,并开发了一种新的贝叶斯不确定性估计方法。实验揭示了线上准确性和一致性指标的局限性,强调了引入贝叶斯不确定性的潜力。

缓解不合理身体区域的虚假预测

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-24T00:00:00Z

本研究通过fine-tuning基础模型,证明其在医学影像领域的优越性,并开发了一种新的贝叶斯不确定性估计方法。实验揭示了线上准确性和一致性指标的局限性,强调了引入贝叶斯不确定性的潜力。

通过线上协议预测基础模型的性能

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-04-02T00:00:00Z

本研究通过fine-tuning基础模型,证明其在医学影像领域的优越性,并开发了一种新的贝叶斯不确定性估计方法。实验揭示了线上准确性和一致性指标的局限性,强调了引入贝叶斯不确定性的潜力。

纹理偏见的束缚?深度实例分割的大规模比较

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-01-17T00:00:00Z

研究创建了名为RETRO的模型,通过从大型语料库中检索与前面token相似的文档块来改善自回归语言模型的条件。RETRO结合了一个冻结的Bert检索器、一个可微分的编码器和一个分块交叉关注机制,可以预测token并在fine-tuning后转化为下游的knowledge-intensive任务。该研究为提高语言模型的性能开辟了新的途径。

BTR: 用于高效检索的二进制标记表示增强语言模型

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-10-02T00:00:00Z

该研究将多模态大型语言模型视为图像分类器,并引入EMT评估现有的MLLM在图像分类任务上的性能。研究发现,几乎所有评估的MLLM在标准图像分类任务上无法保持与视觉编码器相同的性能水平,并且随着fine-tuning的进行,MLLM开始产生幻觉,并导致了显著的泛化能力损失。因此,MLLM在标准图像分类任务上的性能仍有待提高。

多模型大语言模型中的灾难性遗忘研究

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-09-19T00:00:00Z

GPT-3.5 Turbo 已经过微调,GPT-4 的微调版本将在秋季发布。开发者可以针对特定的使用场景定制和提升模型的性能。GPT-3.5 Turbo 在某些特定任务中表现优于 GPT-4。微调可以改善可操作性、输出格式和自定义风格,同时减少令牌使用和成本。安全功能得以保留。微调后的 GPT-3.5 的定价是原始版本的 8 倍。微调用户界面将很快发布。

GPT-3.5 Turbo 微调功能发布并更新 API

dotNET跨平台
dotNET跨平台 · 2023-09-03T00:26:02Z

本文研究了faithfulness metrics在对话摘要任务中的应用,发现大多数度量方法在对话数据上的表现与人类判断相关性较差。为了提高faithfulness metrics的性能,采用了fine-tuning和unlikelihood training等技术。最后提出了T0-Score度量方法,能够稳定提高评价性能。

利用最长支持子序列评估忠实度

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2023-08-23T00:00:00Z

大模型是对语言理解能力出色的人,通过文本输入来满足需求。Prompt引导大模型回答,Token是处理的最小单元,Embedding编码文本为向量,方便语义相似度比较。Fine-Tuning调整模型以匹配特定任务。通过Embedding和Fine-Tuning实现大模型问答应用。使用Embedding将文本内容向量化为数据库,再通过Fine-Tuning训练模型以满足用户需求。这些技术相互关联,提高大模型效果。

详解AI大模型行业黑话,迅速搞懂提示工程(prompt)、向量工程(embedding)、微调工程(fine-tune)

分享AI芯片开发经验
分享AI芯片开发经验 · 2023-06-29T03:02:52Z

Jina AI Finetuner can bring performance improvements of up to 63% to pre-trained CLIP models. Here is how we did that.

How Much Do We Get by Finetuning CLIP?

Jina AI
Jina AI · 2022-10-27T11:57:35Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码