符号计算机器学习中的数据集与范式教训:基于 CAD 的案例研究
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本文介绍了在符号计算中使用机器学习的经验教训,通过案例研究展示了如何在变量排序选择中应用机器学习,并提出了数据集平衡和扩增的方法来改善结果。文章还讨论了将分类方法转换为回归范例的技巧。
🎯
关键要点
- 符号计算算法的选择可能影响资源需求,但不影响输出正确性。
- 机器学习模型可以针对每个问题单独完成选择。
- 在机器学习之前分析数据集是重要的。
- 不同的机器学习范例可以被使用。
- 通过圆柱代数分解的变量排序选择案例研究展示了结果。
- 发现变量排序决策存在数据集不平衡的问题。
- 引入增广技术以平衡和扩增数据集。
- 机器学习结果分别平均提高了28%和38%。
- 现有的分类方法可以转换为回归范例,扩大了应用范围。
➡️