💡
原文英文,约200词,阅读约需1分钟。
📝
内容提要
在使用Hugging Face的Trainer和DeepSpeed集成训练模型时,遇到张量大小不匹配的错误,具体是张量a的大小(50)与张量b的大小(3)在非单例维度上不匹配。已检查输入ids和标签形状一致,确认批量大小,并确保模型在设备上正确放置。
🎯
关键要点
- 使用Hugging Face的Trainer与DeepSpeed集成训练模型时遇到张量大小不匹配的错误。
- 错误信息显示张量a的大小(50)与张量b的大小(3)在非单例维度上不匹配。
- 已检查输入ids和标签的形状一致性。
- 确认了Trainer配置和DeepSpeed配置中的批量大小。
- 确保模型在设备上(cuda或cpu)正确放置。
➡️