大语言模型最喜欢哪种表格格式？Markdown、CSV、JSON、XML、YAML…

小众软件 ·

大语言模型最喜欢哪种表格格式？Markdown、CSV、JSON、XML、YAML…

💡 原文中文，约2300字，阅读约需6分钟。

📝

内容提要

在测试中，Markdown-KV格式的准确率最高（60.7%），但消耗的token最多，比CSV多2.7倍。CSV和JSONL格式的准确率较低（44.3%、45%），建议避免使用。Markdown表格在可读性和成本之间是折中选择（准确率51.9%）。

🎯

关键要点

在测试中，Markdown-KV格式的准确率最高（60.7%），但消耗的token最多，比CSV多2.7倍。
CSV和JSONL格式的准确率较低（44.3%、45%），建议避免使用。
Markdown表格在可读性和成本之间是折中选择（准确率51.9%）。
测试使用了GPT-4.1-nano模型，评估了11种不同格式的数据集。
Markdown-KV格式是一种在Markdown文档中采用'key: value'键值对的表示方式。
测试结果显示，Markdown-KV格式的token消耗为52,104，其他格式的消耗各不相同。
局限性包括仅测试了GPT-4.1 nano，以及一种数据结构，数据量较大可能造成干扰。

🏷️

继续阅读

CLion 2026.1 EAP中的DAP调试器的TCP连接、数值格式的不同以及更多内容
Natvis性能显著提升，使用MSVC工具链的LLDB自定义调试器，调试速度提高超过80倍，内存使用减少2.5倍，特别适合大型项目开发者，CLion和Rider用户受益。
HandBrake 1.11 新增了 ProRes、DNxHR 编码器和 MOV 输出格式
开源视频转码器HandBrake发布1.11.0版本，新增DNxHR和ProRes编码器，支持最高4K分辨率的MOV输出，增加AMD VCN AV1编码器...
20250310
作者经历了一次长时间的睡眠，梦见了许多不可能的人和故事。因工作过度感到虚弱，意识到需要休息，决定减少工作时间，以保持创造力和好奇心。
AI客服越智能越坑人？坑了商家、坑客户，咋办？
你是否也在烦恼AI客服只会兜圈子、不给退款、死活不转人工？这期内容拆解AI客服常见套路，教你识别“只会聊天不办事”的系统，并学会更高效地和AI客服沟通。 ...
本周PSC动态（217）| 2026年3月9日
我们召开了简短会议，讨论潜在新核心团队成员的进展，决定在所有人回复后投票。发现PSC过渡中遗漏了一个小步骤，决定制定检查清单。会议时间有限，未讨论太多问题...
2026 03 10 HackerNews
爱尔兰将在2025年关闭最后一座燃煤电厂，成为欧洲第15个无煤国家。尽管风能和太阳能发展迅速，环保组织仍呼吁加快可再生能源建设和提升电网灵活性。此举为其他...

大语言模型最喜欢哪种表格格式？Markdown、CSV、JSON、XML、YAML…

内容提要

关键要点

标签

继续阅读