Rust.cc ·

大模型能否取代程序员，写点代码试试吧

💡 原文中文，约3700字，阅读约需9分钟。

📝

内容提要

大模型代替程序员编写代码是具有挑战性的任务，建立低代码工具可以提高大模型的编程能力。测试结果显示gpt-4o模型表现最好，成功率100%，平均生成时间4.7秒。总体来说，大模型具有较高的性价比。

🎯

关键要点

大模型代替程序员编写代码是一个具有挑战性的任务。
编写代码不仅涉及逻辑表达，还包括对环境依赖、资源管理和错误处理的考虑。
大模型目前作为编程辅助工具，需要程序员监督和修改生成的代码。
建立低代码工具可以让大模型专注于逻辑生成，减少环境依赖。
测试方法通过让不同的大模型根据相同的提示生成代码并检测运行结果。
使用专为大模型定制的低代码工具a2a，简化了环境依赖。
测试逻辑涉及数据库操作、文件读取和数据处理。
gpt-4o模型在测试中表现最佳，成功率100%，平均生成时间4.7秒。
其他模型如anthropic.claude-3-5-sonnet和glm-4-plus也表现良好，成功率均为100%。
gpt-4o-mini在13次测试中成功率93%，性价比高。
通义千问家族模型表现不错，成功率在90%以上。
gemini-1.5-flash模型成功率较低，但速度快且成本低，性价比高。

❓

延伸问答

大模型能否完全取代程序员编写代码？

大模型目前作为编程辅助工具，仍需程序员监督和修改生成的代码，无法完全取代程序员。

低代码工具如何帮助大模型编写代码？

低代码工具可以让大模型专注于逻辑生成，减少对环境依赖，从而提高编程效率。

在测试中，哪个大模型表现最好？

gpt-4o模型在测试中表现最佳，成功率为100%，平均生成时间为4.7秒。

大模型编写代码时需要考虑哪些因素？

编写代码时需要考虑逻辑表达、环境依赖、资源管理和错误处理等因素。

gpt-4o-mini的性价比如何？

gpt-4o-mini在13次测试中成功率为93%，且性价比高，生成代码的速度也较快。

大模型生成代码的测试方法是什么？

测试方法是让不同的大模型根据相同的提示生成代码，并检测运行结果是否符合预期。

🏷️

标签

低代码工具大模型性价比程序员编程能力

➡️

继续阅读

自建智能体账单真相：1张GPU能扛住几个程序员？
金句：人均年烧九万刀，谁家老板扛得住？你猜这钱去哪了？ AI编程助手正在把程序员变成人肉提款机。过去半年，GitHub Copilot改按token收费，...
奇妙的旋转浮空大冒险《黄油猫》今日上线蒸汽平台
猫猫落地总是能四脚朝下，吐司永远是抹着黄油的那面拍在地上，那么黄油吐司加猫猫呢？永不落地，旋转起来！好评如潮的平台解谜游戏《黄油猫》今日（7月30日）正式...
音视频中台的关键能力有哪些
选音视频中台的时候，厂商给你的功能清单可能长达几十项。但真正决定中台能不能用得起来、用得久的，其实集中在五个维度的核心能力上。本文以即构(ZEGO)的音视...
Qt Creator 20.0.1 released
We are happy to announce the release of Qt Creator 20.0.1! The release improv...
自研音视频中台和购买哪个更划算
自研音视频中台和购买哪个更划算？这是选型时最常被问的问题，也是最容易被厂商用话术带偏的问题。本文不替你做决定，而是把自研和购买的完整成本构成、适用条件和隐...
微软向用户推送不可卸载的OneDrive Photos应用还是基于WebView开发的
#软件资讯诸多用户抱怨微软静默推送安装 OneDrive Photos 应用，而且还不是原生应用而是基于 WebView2 开发的。该应用本身捆绑在 O...