The JetBrains Blog ·

OpenAI与DeepSeek：哪款AI对Kotlin的理解更佳？

💡 原文英文，约1500词，阅读约需6分钟。

📝

内容提要

DeepSeek-R1等AI模型在Kotlin编程方面表现优异，经过KotlinHumanEval和Kotlin_QA基准测试，生成代码和回答问题的能力突出，但速度较慢，且存在知识不全和错误的情况。

🎯

🔎

DeepSeek-R1在Kotlin编程方面表现出色，尤其在生成代码和回答问题的准确性上。然而，其速度较慢，可能不适合实时应用。此外，模型在处理复杂问题时仍存在知识不全和错误的情况，用户在使用时需谨慎验证其输出。

KotlinHumanEval和Kotlin_QA等基准测试为评估AI模型在Kotlin编程中的表现提供了重要依据。这些测试不仅关注代码生成能力，还评估模型对Kotlin相关问题的回答质量，帮助开发者选择合适的工具。

随着McEval和M2rc-Eval等新兴基准的出现，Kotlin编程的评估将更加全面。这些基准有助于提升模型的多语言支持和解释能力，未来可能会对Kotlin开发者的工作产生积极影响。

❓

DeepSeek-R1在KotlinHumanEval基准测试中的成功率为88.82%。

OpenAI的成功率为91.93%，而DeepSeek-R1为88.82%，两者在Kotlin编程方面表现接近。

DeepSeek-R1在处理Kotlin代码时速度较慢，且存在知识不全和错误的情况。

Kotlin_QA基准测试旨在评估不同模型对Kotlin相关问题的回答质量。

在Kotlin_QA基准测试中，DeepSeek-R1表现最佳，平均评分为8.79。

DeepSeek-R1在开放性问题和推理方面表现优异，优于其他模型。

🏷️