小红花·文摘

本文对四款国产大模型（GLM 5.1、Kimi K2.6、Mimo v2.5 Pro 和 DeepSeek V4 Pro）的编码能力进行了实测。结果显示，这些模型在短链路和简单任务中表现良好，但在复杂工程中容易出现上下文丢失和逻辑错误。尽管能够生成代码，但在高风险模块上仍需人工审核以确保安全性和准确性。总体而言，国产模型可作为辅助工具，但不应完全依赖。