ESG 数据去噪:利用机器学习和预测区间量化缺失数据的不确定性
内容提要
本文探讨了利用机器学习算法提升ESG特征与金融绩效的关联性,提出了一种超越传统ESG评分的股票筛选方法。研究表明,机器学习能够挖掘企业ESG的Alpha,帮助公司制定更具影响力的倡议,并为缺乏评级的公司提供支持。此外,研究还创新性地处理缺失值和时间序列数据插补,强调数据驱动决策的重要性。
关键要点
-
利用机器学习算法,研究发现ESG特征与金融绩效之间存在非线性关联,提出了一种超越传统ESG评分的股票筛选方法。
-
研究通过社会情感考量创建数据驱动的ESG评估体系,帮助公司制定更具影响力的倡议。
-
使用Python网络爬虫和自然语言处理算法对ESG子类别进行情感评分,训练机器学习模型以测试其预测能力。
-
提出了一种可解释机器学习的方法来处理缺失数据,增强用户对缺失机制的理解。
-
研究探讨了使用机器学习算法预测和填补分类数据集中的缺失值,强调了集成模型的有效性。
-
提出了一种非生成时间序列插补方法,结合深度集成与分位数回归,能够准确插补时间序列数据。
-
研究评估了缺失时间性和静态观测数据源对分类和回归任务的影响,发现集成策略具有高预测稳健性。
-
通过异构集成模型预测ESG评级,能够降低成本并提高可扩展性,超越既往成果。
-
利用生成模型进行概率预测,避免潜在错误,提高连续排名概率得分的性能。
延伸问答
如何利用机器学习提升ESG特征与金融绩效的关联性?
通过非线性关联分析,机器学习能够挖掘企业ESG的Alpha,提出超越传统ESG评分的股票筛选方法。
文章中提到的情感评分是如何生成的?
使用Python网络爬虫和自然语言处理算法,从多个数据源收集数据并对ESG子类别进行情感评分。
研究中如何处理缺失数据?
采用可解释机器学习的方法,使用高精度的玻璃盒可解释性增强机(EBMs)来处理缺失值。
集成模型在缺失值填补中有什么优势?
集成模型在提高预测的准确性和鲁棒性方面特别有效,能够处理不同的数据集和缺失值模式。
非生成时间序列插补方法的特点是什么?
该方法结合深度集成与分位数回归,能够高效准确地插补时间序列数据并估计不确定性。
如何通过机器学习模型预测ESG评级?
使用前馈神经网络、CatBoost和XGBoost的异构集成模型,能够降低成本并提高可扩展性。