小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI
使用张量并行在多个GPU上训练大型模型

张量并行是一种模型并行技术,通过在特定维度上分割张量,将计算分配到多个设备,适用于参数量巨大的模型。本文介绍了在PyTorch中实现张量并行的设计和训练步骤。

使用张量并行在多个GPU上训练大型模型

MachineLearningMastery.com
MachineLearningMastery.com · 2025-12-31T21:22:39Z
AutoEncoder介绍

本文介绍了自编码器的基本原理及其在Pytorch中的实现,主要用于动漫头像重构。自编码器通过编码器将输入图像压缩为向量,再通过解码器进行还原。文章详细阐述了网络结构、训练步骤及结果展示。

AutoEncoder介绍

文艺数学君
文艺数学君 · 2025-12-23T23:51:50Z

DeepSeek的R1模型利用无须人类反馈的群体相对策略优化(GRPO)技术,提升了大语言模型的推理能力。GRPO使模型能够通过比较多个答案的得分进行自主学习。使用Unsloth,普通GPU也能训练15B参数的模型。文章详细介绍了训练步骤,包括环境设置、模型初始化、数据集准备和奖励函数设计,从而实现更高效的推理模型。

DeepSeek级AI?仅需7个简单步骤训练您的推理模型!

KDnuggets
KDnuggets · 2025-02-27T13:15:21Z

本文介绍了如何使用HuggingFace Transformers微调大型语言模型(LLMs)。微调是在特定任务或数据集上训练预训练模型,以提升其在特定领域的表现。文章讨论了微调的重要性、应对模型生成不准确内容的策略(如检索增强生成、提示工程和微调),以及微调的具体步骤,包括选择模型、准备数据、设置参数、创建训练器、训练和评估。

使用 HuggingFace 微调大型语言模型

DEV Community
DEV Community · 2024-10-03T07:21:21Z

本文介绍了Stable Diffusion中的Lora模型,它是一种用于微调大语言模型的低次序适应技术。Lora模型允许用户在不修改SD大模型的情况下,利用少量数据训练出具有特定画风、IP或人物特征的模型。文章还介绍了Lora模型的使用方法和训练步骤。

ComfyUI 基础教程(四) —— 应用 LoRA 模型控制图像生成特征 - SharpCJ

SharpCJ
SharpCJ · 2024-09-08T12:50:00Z

本文总结了大模型的技术、本质和未来趋势,介绍了人工智能的发展历史和大模型的训练步骤。同时讨论了大模型面临的问题和相关技术,如Prompt Engineering、RAG、LLM Agent和多模态学习。最后展望了未来AI与人类的协同关系的发展趋势。

大模型技术及趋势总结

京东科技开发者
京东科技开发者 · 2024-06-21T09:14:44Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
友情链接: MOGE.AI 九胧科技 模力方舟 Gitee AI 菜鸟教程 Remio.AI DeekSeek连连 53AI 神龙海外代理IP IPIPGO全球代理IP 东波哥的博客 匡优考试在线考试系统 开源服务指南 蓝莺IM Solo 独立开发者社区 AI酷站导航 极客Fun 我爱水煮鱼 周报生成器 He3.app 简单简历 白鲸出海 T沙龙 职友集 TechParty 蟒周刊 Best AI Music Generator

小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码