该研究解决了机器学习中表格数据特征工程的复杂性问题,这是一个依赖于人类专业知识和深厚领域知识的劳动密集型任务。论文提出了一种新颖的框架FeRG-LLM,利用大型语言模型自动执行特征工程,展示了其出色的思维链能力,并通过对话细化模型,从而在多个数据集上实现优于传统模型的表现。此工作不仅提高了特征生成的效率和效果,还能够在本地部署,解决了安全性和成本控制问题。
该研究提出了FeRG-LLM框架,利用大型语言模型自动化表格数据特征工程,提升效率与效果,且在多个数据集上优于传统模型,同时解决了安全性和成本问题。