小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

随着大语言模型(LLM)的普及,相关技术和应用生态迅速发展。为帮助人们掌握LLM,开源项目LLM Course应运而生,提供系统化的学习路径,涵盖模型微调、量化和高级应用,适合初学者和开发者。HyperAI也推出了相关教程,方便用户实践。

在线教程丨狂揽7.7万stars,LLM Course覆盖从入门到进阶的干货知识与实战课程

HyperAI超神经
HyperAI超神经 · 2026-03-19T07:28:22Z
GTC聚焦于本地运行最新开放模型和AI代理的NVIDIA RTX个人电脑和DGX Sparks

生成式AI(如OpenClaw)引入了新的个人代理计算机类别。NVIDIA GTC展示了支持本地代理开发与定制的新模型和优化,提升了AI助手的隐私和性能。Unsloth Studio简化了模型微调过程,适合开发者和爱好者使用。

GTC聚焦于本地运行最新开放模型和AI代理的NVIDIA RTX个人电脑和DGX Sparks

NVIDIA Blog
NVIDIA Blog · 2026-03-17T13:00:46Z
企业系统AI应用集成:常用知识增强技术方案与Microsoft Agent Framework实践

随着大语言模型在自然语言处理中的应用增加,企业面临知识更新滞后和专业数据不足的问题。为此,业界提出了模型微调、检索增强生成(RAG)、工具调用和Agent架构等技术方案。微软的Agent Framework支持智能代理的构建,通过整合外部知识和工具,提升AI应用的实用性和可靠性。

企业系统AI应用集成:常用知识增强技术方案与Microsoft Agent Framework实践

dotNET跨平台
dotNET跨平台 · 2026-03-16T23:43:17Z

本文介绍了十个有助于构建和部署大型语言模型(LLM)应用的Python库和框架,如Hugging Face Transformers、LangChain和Pydantic AI。这些工具简化了模型访问、应用构建、检索增强生成(RAG)和模型微调的过程,提高了开发效率和生产环境性能。

每位LLM工程师必知的10个Python库

KDnuggets
KDnuggets · 2026-03-10T12:00:33Z

DeepSeek-V3.2通过自动合成高质量旅行规划数据,提升行程规划能力。该流程包括数据集准备和模型微调,采用无人工干预生成任务,确保数据质量和数量,最终生成的任务可验证,适用于强化学习训练。

以旅行规划(Trip Planning)为例,看 DeepSeek-V3.2 如何合成高质量训练数据(2025)

ARTHURCHIAO'S BLOG
ARTHURCHIAO'S BLOG · 2025-12-16T00:00:00Z
准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(下)

本文介绍了大模型文本审核系统的优化项目,重点在第三阶段的模型微调方案。通过训练XLM-RoBERTa Base模型,误判率降低至近5%,准确率达到95%。相较于大型模型,小型模型在特定场景下表现更佳,提供高效的长期解决方案。建议在生产环境中使用该模型,并保持人工审核和定期评估,以持续优化系统性能。

准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(下)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2025-05-20T01:35:07Z

本研究提出了一种思维链跃迁桥接任务,以解决大型语言模型在数学任务中因缺失中间步骤而导致的思维跃迁问题。实验结果显示,经过微调的模型在数学推理基准上的表现提升最高可达5.87%。

Bridging the Gap: Mitigating Thought Jumps to Enhance Chain-of-Thought Fine-Tuning

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-20T00:00:00Z
离线视频-LLM 现可理解实时视频流:苹果研究人员推出 StreamBridge,实现多轮主动视频理解

Video-LLM 处理离线视频,但在流媒体场景中存在局限。StreamBridge 框架通过结合内存缓冲区和轻量级激活模型,解决了多轮实时理解和主动响应生成的挑战,提升了流媒体视频的理解能力。同时,引入的新数据集 Stream-IT 支持更好的模型微调,展现了在机器人和自动驾驶等领域的应用潜力。

离线视频-LLM 现可理解实时视频流:苹果研究人员推出 StreamBridge,实现多轮主动视频理解

实时互动网
实时互动网 · 2025-05-13T02:42:55Z

本研究探讨了人工智能在地球观测中的可靠性,提出基准数据集以评估AI能力。通过微调合成数据,提升了开放模型的表现,使小模型在准确性上与大模型相当。研究强调在实现AI自动化地球观测前需解决的关键挑战,并指明未来研究方向。

面向地球观测的LLM智能体

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本研究提出了一种新方法,通过自适应问题难度生成高质量链式思维(CoT)数据,以解决大型语言模型在复杂任务中的推理能力不均衡问题。该方法显著降低了数据生成成本,提高了模型微调效率,并在数学竞赛和代码生成领域验证了其有效性。

Rethinking the Generation of High-Quality CoT Data from the Perspective of LLM-Adaptive Question Difficulty Grading

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-04-16T00:00:00Z

本文介绍了如何使用Hugging Face的预训练模型构建自动语音识别(ASR)系统,包括加载语音数据集、微调Wav2Vec2模型、评估模型性能(字错误率)以及实时语音转文本推断。通过安装必要库、预处理音频数据、定义训练参数和训练模型,实现了高效的ASR系统。

使用PyTorch和Hugging Face构建自动语音识别系统

KDnuggets
KDnuggets · 2025-03-26T14:00:31Z
第二部分 - 文本分类魔法:将原始文本转化为情感洞察

本文介绍了如何利用Cohere的分类API快速构建情感分析系统。通过简单的数据准备和API调用,用户无需具备机器学习专业知识即可实现高效的情感分类。教程涵盖数据准备、模型微调和性能评估等步骤,最终模型在测试集上达到了93.20%的准确率,展示了其在情感检测中的强大能力。

第二部分 - 文本分类魔法:将原始文本转化为情感洞察

DEV Community
DEV Community · 2025-03-23T11:39:49Z
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

GRPO算法通过组内样本比较计算策略梯度,降低训练不稳定性并提高效率。Andriy Burkov发布了基于Qwen2.5-1.5B-Instruct模型的GRPO实现教程,涵盖数据准备、评估和奖励函数,最终实现模型微调,显著提升准确率。

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

机器之心
机器之心 · 2025-03-02T06:16:41Z

本研究提出了一种新策略,通过集成方法量化大型语言模型(LLM)分类结果的不确定性。模型微调降低了输出对输入词汇变动的敏感性,从而提高了分类的可靠性,增强了LLM在实际应用中的可信度和可解释性。

Quantifying Uncertainty in Large Language Model Classifications Using an Ensemble-Based Approach

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-02-12T00:00:00Z
在AI应用中,微调与提示工程哪种方法更合适?

企业在AI应用中需在快速提示工程与深入模型微调之间做出选择。提示工程适合一般任务,快速且成本低,但定制性不足;而微调通过特定数据集提升模型性能,适合专业需求。选择合适的基础设施和工具至关重要。

在AI应用中,微调与提示工程哪种方法更合适?

The New Stack
The New Stack · 2025-02-10T17:00:50Z
LLM 微调实践 – 利用大语言模型微调进行翻译质量检测(下)

本文探讨了翻译质量检测模型的微调过程,强调数据不平衡对模型性能的影响。通过分析错误类型和优化COT序列,提出了多任务微调策略,以提高模型的检出率和精准率。增加训练数据的数量和质量显著提升了模型在复杂任务中的表现。

LLM 微调实践 – 利用大语言模型微调进行翻译质量检测(下)

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-12-27T02:57:44Z
炼石成丹:大语言模型微调实战系列(二)模型微调篇

模型微调涉及选择合适的框架和方法,如全参数微调、PEFT和LoRA。需考虑计算资源和性能,使用Amazon SageMaker或ModelHub可简化操作。监控指标包括loss和准确度,若结果不理想,可通过数据增强和调整超参数优化。微调是一个循环迭代的过程,最终需评估模型效果并进行部署。

炼石成丹:大语言模型微调实战系列(二)模型微调篇

亚马逊AWS官方博客
亚马逊AWS官方博客 · 2024-12-23T03:03:28Z

在数据科学项目中,构建预测模型至关重要。建议包括:1. 选择相关特征,剔除无关数据;2. 清理和准备数据,确保数据质量;3. 探索多种模型和方法;4. 进行交叉验证以评估模型;5. 微调有前景的模型以提升性能;6. 实施持续反馈和再训练机制,以适应市场变化。

提升数据科学中预测模型的6种方法

KDnuggets
KDnuggets · 2024-12-19T13:00:52Z

本研究提出了MegaCOIN数据集,以提升视觉语言模型在色彩感知和空间上下文理解方面的能力。经过微调,模型在视觉评估任务中表现显著改善,超越了GPT-4o等闭源模型。

MegaCOIN: Enhancing Medium-Grained Color Perception in Vision-Language Models

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-12-05T00:00:00Z

本研究提出了一种改进的自监督学习模型微调方案,针对低资源语言的自动语音识别问题。通过增加中间适应步骤,仅更新1-5%的模型参数,实验证明该方法在适应未见语言时,字符和音素错误率提高了28%。

How to Learn a New Language? An Efficient Solution for Adapting Self-Supervised Learning Models to Unseen Languages in Low-Resource Scenarios

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2024-11-27T00:00:00Z
  • <<
  • <
  • 1 (current)
  • 2
  • 3
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码