小众软件 ·

大语言模型最喜欢哪种表格格式？Markdown、CSV、JSON、XML、YAML…

Q: 使用CSV格式时的准确率是多少？

CSV格式的准确率为44.3%。

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

在测试中，Markdown-KV格式的准确率最高（60.7%），但消耗的token最多，比CSV多2.7倍。CSV和JSONL格式的准确率较低（44.3%、45%），建议避免使用。Markdown表格在可读性和成本之间是折中选择（准确率51.9%）。

🎯

关键要点

在测试中，Markdown-KV格式的准确率最高（60.7%），但消耗的token最多，比CSV多2.7倍。
CSV和JSONL格式的准确率较低（44.3%、45%），建议避免使用。
Markdown表格在可读性和成本之间是折中选择（准确率51.9%）。
测试使用了GPT-4.1-nano模型，评估了11种不同格式的数据集。
Markdown-KV格式是一种在Markdown文档中采用'key: value'键值对的表示方式。
测试结果显示，Markdown-KV格式的token消耗为52,104，其他格式的消耗各不相同。
局限性包括仅测试了GPT-4.1 nano，以及一种数据结构，数据量较大可能造成干扰。

🔎

延伸解读

Markdown-KV格式的优势与劣势

Markdown-KV格式在准确率上表现优异，达到60.7%，但其token消耗也最高，远超其他格式。这意味着在追求高准确率的同时，用户需考虑token的使用成本，尤其在大规模数据处理时，可能会影响整体效率。

CSV与JSONL格式的局限性

测试结果显示，CSV和JSONL格式的准确率较低，分别为44.3%和45%。因此，在选择数据格式时，建议用户避免默认使用这两种格式，尤其是在对准确性要求较高的场景中。

可读性与成本的平衡

Markdown表格格式在可读性和token消耗之间提供了一个折中选择，准确率为51.9%。对于需要兼顾数据展示和处理效率的用户，Markdown表格可能是一个值得考虑的选项，尤其是在小规模数据集的情况下。

❓

延伸问答

Markdown-KV格式的准确率是多少？

Markdown-KV格式的准确率为60.7%。

使用CSV格式时的准确率是多少？

CSV格式的准确率为44.3%。

Markdown表格在可读性和成本之间的表现如何？

Markdown表格的准确率为51.9%，在可读性和成本之间是折中选择。

测试中使用了哪种大语言模型？

测试中使用了GPT-4.1-nano模型。

Markdown-KV格式是什么？

Markdown-KV格式是一种在Markdown文档中采用'key: value'键值对的表示方式，用于组织结构化数据。

测试中有哪些格式的准确率较低？

CSV和JSONL格式的准确率较低，分别为44.3%和45%。

🏷️