CardBench:用于关系数据库学习基数估计的基准

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

主动学习通过设计查询策略来选择信息量最大的数据点进行标记,提高学习算法效率和性能。ALPBench是一个支持主动学习流程的工具,包含86个数据集和5个主动学习设置,用于评估不同学习算法和查询策略的性能。

🎯

关键要点

  • 主动学习通过设计查询策略选择信息量最大的数据点进行标记。
  • 主动学习旨在提高学习算法的效率和性能。
  • 目前缺乏对不同查询策略性能进行比较的标准化基准。
  • ALPBench是一个支持主动学习流程的工具,提供规范、执行和性能监控。
  • ALPBench内置可确保可重复评估的措施,保存精确的数据集拆分和超参数设置。
  • ALPBench包含86个真实的表格分类数据集和5个主动学习设置,产生430个主动学习问题。
  • 示例研究评估了9种查询策略与8种学习算法在两种不同设置下的表现。
🏷️

标签

➡️

继续阅读