DEV Community ·

探索大型语言模型：代码补全的盲测研究

💡 原文英文，约2100词，阅读约需8分钟。

📝

内容提要

经过四个月的盲测，比较了三款AI代码补全工具的表现。结果显示，GitHub Copilot的接受率最高（3.4%），Supermaven提供了最多建议，而Codeium仅有0.5%的接受率，最终被停用。研究揭示了不同大型语言模型在实际编码中的显著差异。

🎯

❓

GitHub Copilot的接受率最高，达到3.4%。

Supermaven提供了最多的建议，但接受率仅为1.9%；Codeium的表现最差，接受率仅为0.5%，最终被停用。

研究揭示了不同大型语言模型在实际编码中的显著差异，特别是在接受率和建议质量方面。

Codeium的接受率仅为0.5%，表现不佳，因此在七天后被停用。

Copilot提供较少但质量更高的建议，而Supermaven提供更多但精度较低的建议。

未来的研究可以扩展到更多的代码补全工具，特别是开源模型，并进行多用户研究以获得更全面的结果。

🏷️

GitHub Copilot CLI 入门：交互模式与非交互模式
本文介绍了使用GitHub Copilot CLI创建的项目，包括表情符号列表生成器和个人组织指挥中心。此外，还提到了一款名为GitHub Secure ...
生物研究正在变成软件工程：AI开始接管生物实验大脑！
生物研究正逐渐依赖AI进行数据分析，推动科学判断的自动化。AI能够高效筛选和分析生物数据，提升研究效率。未来，数据分析能力将成为生物研究的核心，快速将数据...
安全公告：Qt声明模块中VectorImage组件的QML代码注入漏洞影响Qt
Qt的VectorImage组件存在代码注入漏洞（CVE-2025-14576），影响版本6.8.0至6.8.6及6.9.0至6.10.1。该漏洞允许恶意...
五种强大的Python装饰器，构建整洁的AI代码
本文介绍了五种实用的Python装饰器，旨在提高AI和机器学习代码的整洁性。这些装饰器包括：限制并发请求、结构化日志记录、特征注入、确定性种子设置和开发模...
营收破千亿、装机量超 25 亿，苹果交出史上最强三月季度答卷
【TechWeb】5月1日消息，据外媒报道，苹果发布 2026 财年第二季度（自然年第一季度）财报，并召开财报电话会议，宣布本季度创下史上最佳三月季度业绩...
在Aurora中对大型表执行ALTER TABLE
Recently, we received an alert for one of our Managed Services customers indi...