From Measurement Instruments to Training Data: Leveraging Theory-Driven Synthetic Training Data for Measuring Social Constructs
💡
原文英文,约100词,阅读约需1分钟。
📝
内容提要
本研究提出了一种理论驱动的合成训练数据方法,以提高计算文本分类中多维社会构念的测量精确度。研究表明,该方法有效减少对标注数据的依赖,尤其在政治话题分类中表现突出。
🎯
关键要点
-
本研究提出了一种理论驱动的合成训练数据方法,以提高计算文本分类中多维社会构念的测量精确度。
-
该方法有效减少对标注数据的依赖,尤其在政治话题分类中表现突出。
-
研究分析了性别歧视和政治话题的两项研究,验证了合成数据的有效性。
➡️