From Measurement Instruments to Training Data: Leveraging Theory-Driven Synthetic Training Data for Measuring Social Constructs

💡 原文英文,约100词,阅读约需1分钟。
📝

内容提要

本研究提出了一种理论驱动的合成训练数据方法,以提高计算文本分类中多维社会构念的测量精确度。研究表明,该方法有效减少对标注数据的依赖,尤其在政治话题分类中表现突出。

🎯

关键要点

  • 本研究提出了一种理论驱动的合成训练数据方法,以提高计算文本分类中多维社会构念的测量精确度。

  • 该方法有效减少对标注数据的依赖,尤其在政治话题分类中表现突出。

  • 研究分析了性别歧视和政治话题的两项研究,验证了合成数据的有效性。

➡️

继续阅读