小红花·文摘

一位苹果开发者利用Claude Code完成了95%的macOS应用开发，仅编写了不到1000行代码。Claude能高效处理代码、生成测试和优化UI，显著提升了开发效率。自上线以来，Claude Code已被11.5万开发者使用，处理了1.95亿行代码。

苹果开发者自曝用Claude完成95%开发，开发应用已上架

量子位 ·

安全是一团糟 – Plang如何帮助解决这个问题

DEV Community ·

Cursor重磅上线Claude Max，工具调用一次0.05美元，充值实测一波

机器之心 ·

用了一个月后发现，Devin是真不好用

机器之心 ·

本文介绍了多种新型跨模态和代码处理模型，如UniCode、UniXcoder和KnowCoder。这些模型通过统一的预训练方法和多模态学习，显著提升了视觉数据处理、代码生成和语言转换的性能，尤其在代码相关任务上取得了重要进展。

UniCoder: 通过通用编码扩展代码大规模语言模型

BriefGPT - AI 论文速递 ·

新一代语言模型在软件工程中的应用面临挑战。研究提出了SWE-agent和MAGIS等框架，以提高模型解决GitHub问题的能力。SWE-agent通过自定义界面增强代码处理能力，而MAGIS通过多智能体协作提高问题解决率。此外，RepoBench和RepoClassBench等基准测试评估了代码自动完成和类级生成的效果，强调了结合库级依赖关系的重要性。

代码 R：多智能体和任务图的问题解决

BriefGPT - AI 论文速递 ·

该综述总结了代码处理和语言模型的最新进展，包括50+种模型、30+项评估任务和500多个相关研究。分析了通用语言模型和专门针对代码进行预训练的模型之间的关系和区别，并强调了代码建模的历史转变。讨论了代码特定的特征及其在训练代码语言模型中的应用，并确定了该领域的主要挑战和潜在未来方向。

GenCodeSearchNet：编程语言理解中泛化能力评估的基准测试套件

BriefGPT - AI 论文速递 ·