Suvach -- 生成的印地语 QA 基准
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
本研究介绍了BEnQA数据集,包含孟加拉国中学和高中水平的平行孟加拉语和英语考试题目。观察到孟加拉语和英语中模型性能差异,发现思考链提示对推理问题有利,附加英语翻译有助于回答问题。指向改善孟加拉语和其他资源有限语言中大型语言模型性能的未来研究方向。
🎯
关键要点
- 本研究介绍了BEnQA数据集,包含孟加拉国中学和高中水平的平行孟加拉语和英语考试题目。
- 数据集包含约5000个问题,涵盖科学多个学科,包括事实、应用和推理类问题。
- 基准测试显示孟加拉语和英语中模型性能存在明显差异。
- 研究发现“思考链”提示对推理问题更有利,而对事实问题不太有利。
- 附加英语翻译有助于用孟加拉语回答问题。
- 研究结果指向改善孟加拉语和其他资源有限语言中大型语言模型性能的未来研究方向。
➡️