ESG 情绪分析:人工与语言模型性能比较,包括 GPT
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本研究应用GPT-3.5-turbo和GPT-4进行韩国企业信息披露的语义分析,发现GPT-4在人工评价测试中表现出显著准确性,为GPT模型的评估特性提供了宝贵见解。
🎯
关键要点
- 本研究应用GPT-3.5-turbo和GPT-4进行韩国企业信息披露的语义分析。
- 研究关注韩国KOSPI上市的市值前50家公司月度披露摘要。
- 每个摘要被分配情感评分,范围从1(非常负面)到5(非常正面)。
- 研究比较了人工专家生成的评分与语言模型生成的评分。
- 发现GPT-4在人工评价测试中表现出显著的准确性。
- Spearman相关系数为0.61,简单一致性率为0.82。
- 该研究为GPT模型的评估特性提供了宝贵见解,推动自动语义监控领域的创新。
➡️