💡
原文中文,约2300字,阅读约需6分钟。
📝
内容提要
在测试中,Markdown-KV格式的准确率最高(60.7%),但消耗的token最多,比CSV多2.7倍。CSV和JSONL格式的准确率较低(44.3%、45%),建议避免使用。Markdown表格在可读性和成本之间是折中选择(准确率51.9%)。
🎯
关键要点
- 在测试中,Markdown-KV格式的准确率最高(60.7%),但消耗的token最多,比CSV多2.7倍。
- CSV和JSONL格式的准确率较低(44.3%、45%),建议避免使用。
- Markdown表格在可读性和成本之间是折中选择(准确率51.9%)。
- 测试使用了GPT-4.1-nano模型,评估了11种不同格式的数据集。
- Markdown-KV格式是一种在Markdown文档中采用'key: value'键值对的表示方式。
- 测试结果显示,Markdown-KV格式的token消耗为52,104,其他格式的消耗各不相同。
- 局限性包括仅测试了GPT-4.1 nano,以及一种数据结构,数据量较大可能造成干扰。
🏷️
标签
➡️