小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
小猫都能懂的大模型原理 5 - 后训练

本文介绍了大语言模型的基本原理,重点讲述了监督微调(SFT)和强化学习(RLHF)在训练过程中的作用。通过人类反馈优化生成内容,提高与人类偏好的契合度,微调可降低成本并提升特定领域的效果。

小猫都能懂的大模型原理 5 - 后训练

UsubeniFantasy
UsubeniFantasy · 2025-12-08T05:40:13Z
使用 Azure AI Foundry 对模型进行微调

在工作中遇到RAG技术召回率不足的问题,导致LLM理解偏差。考虑通过微调小模型来处理特定领域问题,以固化知识和统一输出格式。使用AI Foundry进行微调,上传训练数据并调整参数,经过训练后模型能回答特定问题,但仍需多轮调整以优化效果。

使用 Azure AI Foundry 对模型进行微调

dotNET跨平台
dotNET跨平台 · 2025-09-23T00:03:24Z
从‘包装者’到改变世界者:AI应用如何超越模型构建者

在AI领域,'包装者'如Perplexity和Cursor逐渐超越传统模型构建者,专注于用户需求,提升用户体验和实用性。随着模型同质化,应用的执行力愈发重要,'包装者'通过与用户直接互动,创造成功商业模式。未来,专注于特定领域和个性化体验的应用将主导市场。

从‘包装者’到改变世界者:AI应用如何超越模型构建者

DEV Community
DEV Community · 2025-05-01T03:21:02Z

本研究提出了一种协同框架,将专业弱模型与通用强模型结合,以解决大语言模型在特定领域知识不足的问题。实验结果显示,该方法显著提升了模型在关键任务中的表现。

通过对齐偏好实现协同弱强模型合作

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z

本研究提出了一种快速方法,通过结合相邻标记嵌入来优化预训练的静态词嵌入,有效解决词汇缺失问题,增强特定领域应用的多样性,并改善风暴相关术语的表示效果。

Self-Improving Token Embeddings

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-21T00:00:00Z
OpenAI推出新计划,重新定义AI基准标准

OpenAI推出新计划,旨在为法律、金融、医疗等特定领域设计AI基准,以改善模型评分,帮助团队在实际环境中评估模型表现。OpenAI希望与多家公司合作,创建行业特定的基准和评估。

OpenAI推出新计划,重新定义AI基准标准

DEV Community
DEV Community · 2025-04-12T17:59:33Z

本文提出了一种新方法HiRAG,旨在提升检索增强生成(RAG)方法在层次知识利用方面的不足。实验结果表明,HiRAG在性能上显著优于现有方法,展现了在特定领域任务中的潜力。

基于层次知识的检索增强生成

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-03-13T00:00:00Z

本研究提出了一种迭代的逐步验证系统,克服了传统自动化事实验证在医疗领域的不足。评估结果表明,该系统在验证医疗声明时显著提升了性能,显示出在特定领域的高潜力。

逐步事实验证系统用于医疗声明,具备可解释推理

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-20T00:00:00Z

该研究提出了一种无监督的词义消歧系统TreeMatch,结合特定领域知识库和依赖知识,显著提高了消歧精度,测试结果优于基线。

TreeMatch:一个基于依赖知识的完全无监督特定领域词义消歧系统

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-01-05T00:00:00Z

本研究提出了一种新的聚合与适应提示嵌入(AAPE),旨在解决CLIP模型在特定领域分类中的泛化能力不足问题,能够在有限数据下有效适应下游任务。

聚合与适应自然语言提示以实现CLIP的下游泛化

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-31T00:00:00Z

本研究提出集成超级上下文学习(Ensemble SuperICL),通过结合多个微调的小型语言模型,提升大语言模型在特定领域任务中的表现,尤其在医学标签任务中取得了显著成果。

通过集成小型语言模型提升上下文学习

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-29T00:00:00Z

大型语言模型在知识密集任务中表现出色,但其知识泛化能力不明确。KGQuiz评估框架涵盖五个任务和三个领域,实验显示LLMs在简单问答中表现良好,但在复杂推理和特定领域中有挑战。KGQuiz用于分析不同领域和任务的性能变化,以提升LLMs的知识能力。

Llama SLayer 8B:浅层是知识注入的关键

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-10-03T00:00:00Z

大规模视觉语言模型(VLMs)在自然视觉任务中表现出色,推动跨领域的研究者探索特定领域的 VLMs。广义领域提示学习(GDPL)框架解决了学术界对 VLMs 研究受限的问题。GDPL 通过小规模的特定领域基础模型和最少的提示样本,使 VLMs 的识别能力从自然视觉转移到特定领域,无需大量数据或资源。实验证明了 GDPL 的有效性,并展示了在提示学习范式下实现最先进的领域识别性能的能力。

VolDoGer:基于 LLM 辅助的视觉 - 语言任务领域泛化数据集

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-29T00:00:00Z

大规模视觉语言模型(VLMs)在自然视觉任务中表现出色,推动跨领域的研究者探索特定领域的 VLMs。广义领域提示学习(GDPL)框架解决了学术界对 VLMs 研究的挑战。GDPL 通过小规模的特定领域基础模型和最少的提示样本,使 VLMs 的强大识别能力从自然视觉转移到特定领域,无需大量数据或资源。实验证明了 GDPL 的有效性,并展示了在提示学习范式下实现最先进的领域识别性能的能力。

通过无监督知识蒸馏提高学得提示的零样本推理能力

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-07-03T00:00:00Z

大规模视觉语言模型(VLMs)在自然视觉任务中表现出色,推动跨领域的研究者探索特定领域的 VLMs。广义领域提示学习(GDPL)框架通过小规模的特定领域基础模型和最少的提示样本,使 VLMs 的强大识别能力从自然视觉转移到特定领域,无需大量数据或资源。实验证明 GDPL 在不同领域的有效性,并展示了在提示学习范式下实现最先进的领域识别性能的能力。

DKPROMPT:领域知识引导视觉 - 语言模型进行开放世界规划

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-06-25T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码