自助式交叉表格表示学习的扩展实验
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一种基于Transformer的表格表示学习模型,通过利用表格特定的分词器和共享的Transformer主干来进行交叉表格表示学习。该模型通过自我监督的掩码式单元恢复目标进行缺失值填充,并在不同规模的模型上进行训练和评估。
🎯
关键要点
- 介绍了一种基于Transformer的表格表示学习模型。
- 该模型利用表格特定的分词器和共享的Transformer主干进行交叉表格表示学习。
- 训练方法包括单表和交叉表格模型。
- 通过自我监督的掩码式单元恢复目标进行缺失值填充。
- 训练了不同规模的模型,参数范围从约10^4到10^7。
- 模型在包含来自76个不同数据集的135M个训练令牌的预训练数据集上进行训练。
- 使用线性推测在基准数据集上评估预训练模型,并与传统基准进行比较。
- 评估了架构在单表和交叉表格预训练设置中的扩展性。
🏷️
标签
➡️