小红花·文摘
  • 首页
  • 广场
  • 排行榜🏆
  • 直播
  • FAQ
Dify.AI

本研究提出了DeepKD框架,旨在解决知识蒸馏中目标类与非目标类知识冲突及低置信度噪声问题。通过双重解耦和自适应去噪,显著提升了知识转移效果。

DeepKD: A Deep Decoupling and Denoising Knowledge Distillation Trainer

BriefGPT - AI 论文速递
BriefGPT - AI 论文速递 · 2025-05-21T00:00:00Z

本文介绍了如何使用HuggingFace Trainer组件微调通义千问0.5B模型,涵盖环境准备、数据加载和模型训练等步骤,提供简洁有效的实现方案,适合初学者。

使用“古法技术”——HuggingFace Trainer微调训练本地大模型保姆级教程

dotNET跨平台
dotNET跨平台 · 2025-03-03T00:00:57Z

Learn how to develop custom training loop with Hugging Face Transformers and the Trainer API.

How to Use the Trainer API in Hugging Face for Custom Training Loops

KDnuggets
KDnuggets · 2025-02-19T13:00:10Z
在使用DeepSpeed训练时遇到张量大小不匹配的问题

在使用Hugging Face的Trainer和DeepSpeed集成训练模型时,遇到张量大小不匹配的错误,具体是张量a的大小(50)与张量b的大小(3)在非单例维度上不匹配。已检查输入ids和标签形状一致,确认批量大小,并确保模型在设备上正确放置。

在使用DeepSpeed训练时遇到张量大小不匹配的问题

DEV Community
DEV Community · 2024-12-14T07:56:50Z

From PyTorch DDP to 🤗 Accelerate to 🤗 Trainer, mastery of distributed training with ease

Hugging Face - Blog
Hugging Face - Blog · 2022-10-21T00:00:00Z

ScrumAlliance Trainer Retreat Update This is my first trainer retreat, and I am very glad to see many new friends and old friends here. Julie is the facilitator today, and I appreciated her...

ScrumAlliance Trainer Retreat Update

Bob Jiang's Blog
Bob Jiang's Blog · 2019-05-21T00:00:00Z

从想法到实现,我一共花了2年2个月的时间,所以要给自己一些时间。2014年4月我想成为一名CST(Certified Scrum Trainer),2016年6月29日11点终于实现了。先给自己撒花~ 内容大纲 时间线 什么是CST 如何申请CST 基本要求 申请材料 认证流程 我的收获 时间线 2014年4月 - 有了申请CST的想法 2015年1月 - 提交申请材料 2015年4月...

Certified Scrum Trainer (CST)之旅

Bob Jiang's Blog
Bob Jiang's Blog · 2016-07-01T00:00:00Z
  • <<
  • <
  • 1 (current)
  • >
  • >>
👤 个人中心
在公众号发送验证码完成验证
登录验证
在本设备完成一次验证即可继续使用

完成下面两步后,将自动完成登录并继续当前操作。

1 关注公众号
小红花技术领袖公众号二维码
小红花技术领袖
如果当前 App 无法识别二维码,请在微信搜索并关注该公众号
2 发送验证码
在公众号对话中发送下面 4 位验证码
小红花技术领袖俱乐部
小红花·文摘:汇聚分发优质内容
小红花技术领袖俱乐部
Copyright © 2021-
粤ICP备2022094092号-1
公众号 小红花技术领袖俱乐部公众号二维码
视频号 小红花技术领袖俱乐部视频号二维码