TabRepo: 一个大规模的表格模型评估存储库及其 AutoML 应用
原文中文,约400字,阅读约需1分钟。发表于: 。介绍了 TabRepo 数据集,包含了 1206 个模型在 200 个回归和分类数据集上的预测和评估指标。通过使用预计算的模型预测,可以在无需代价的情况下对超参数优化与当前 AutoML 系统的比较以及集成的效果进行分析。同时,展示了该数据集可以用于进行迁移学习,在准确性、运行时间和延迟等方面超过当前最先进的表格系统。
TABBIE是一种通过自我学习目标函数和预训练语言模型对表格进行建模的模型,可用于填充缺失的单元格等任务。该模型提供了所有表子结构的嵌入,并且计算时间较短。作者对模型的学习单元格、列和行的表示进行了质量分析,结果表明它可以理解复杂的表语义和数字趋势。