💡
原文英文,约1300词,阅读约需5分钟。
📝
内容提要
本文介绍了使用Transformers库进行图分类的方法,包括使用Graphormer模型和其他可能的模型,加载和格式化图数据,预处理步骤,加载和微调预训练模型,以及使用Trainer进行训练和保存模型到Hub的步骤。
🎯
关键要点
- 本文介绍了使用Transformers库进行图分类的方法。
- 当前Transformers库中唯一可用的图变换模型是Microsoft的Graphormer。
- 需要安装datasets和transformers库以跟随教程。
- 可以使用Hub上已有的图数据集,或使用自己的数据集。
- 加载图数据集非常简单,可以使用load_dataset函数。
- 图数据集通常以jsonl格式存储,包含多个图的列表。
- 每个图的格式包括edge_index、num_nodes、y、node_feat和edge_attr等属性。
- Graphormer模型的默认预处理生成了节点的入度/出度信息和最短路径等特征。
- 可以加载预训练模型并在下游任务上进行微调。
- 使用Trainer类进行模型训练,需要定义训练配置和评估指标。
- 对于图数据集,调整批量大小和梯度累积步骤非常重要。
- 训练完成后,可以将模型保存到Hub上。
➡️