符号计算机器学习中的数据集与范式教训:基于 CAD 的案例研究

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文介绍了在符号计算中使用机器学习的经验教训,通过案例研究展示了如何在变量排序选择中应用机器学习,并提出了数据集平衡和扩增的方法来改善结果。文章还讨论了将分类方法转换为回归范例的技巧。

🎯

关键要点

  • 符号计算算法的选择可能影响资源需求,但不影响输出正确性。
  • 机器学习模型可以针对每个问题单独完成选择。
  • 在机器学习之前分析数据集是重要的。
  • 不同的机器学习范例可以被使用。
  • 通过圆柱代数分解的变量排序选择案例研究展示了结果。
  • 发现变量排序决策存在数据集不平衡的问题。
  • 引入增广技术以平衡和扩增数据集。
  • 机器学习结果分别平均提高了28%和38%。
  • 现有的分类方法可以转换为回归范例,扩大了应用范围。
➡️

继续阅读