💡
原文中文,约2400字,阅读约需6分钟。
📝
内容提要
数据质量对大模型至关重要,获取真实世界数据是长期课题。书籍《Cooking Data》探讨数据的复杂性,强调数据与社会文化的交织,反思数据生产过程中的不平等和文化盲点。研究者需关注现场调查中的礼物分配,以维护与当地人的关系,确保数据质量。
🎯
关键要点
- 数据质量对大模型至关重要,获取真实世界数据是长期课题。
- 书籍《Cooking Data》探讨数据的复杂性,强调数据与社会文化的交织。
- 数据的概念是虚构的,数据必然与社会和文化环境交织在一起。
- 翻译专家在全球健康项目中至关重要,但翻译质量仍然是数据质量的根源性问题。
- 数据生产是一个有机的、动态的生命周期,而非简单的工业产物。
- 研究项目中不同职能工作者之间的权力关系是不对等的,可能导致偏见。
- 现场调查者常准备小礼品以助调研,但礼物的分发可能引起不平等。
- 与当地人和谐相处,才能保证数据质量和调查的顺利进行。
➡️