小红花·文摘

本研究探讨了大型语言模型（LLMs）在神经网络超参数优化中的应用。通过微调的Code Llama，我们的方法在生成超参数建议方面高效且具有竞争力，显著降低了计算开销，并在根均方误差（RMSE）上表现优异，展示了LLMs在快速实验中的潜力。

Optuna vs Code Llama: Are Large Language Models a New Paradigm for Hyperparameter Tuning?

BriefGPT - AI 论文速递 ·

该研究评估了GitHub Copilot在OpenAPI完成度上的表现，并提出了用Meta的Code Llama模型进行优化的方法。通过语义基准和实验，分析了提示工程和微调对性能的影响。微调后的Code Llama在参数数量远少于Codex的情况下，正确率提升至55.2%。此外，研究改进了代码插入训练技术，解决了提示上下文不足的问题。

aiXcoder-7B：一种轻量级和有效的大型语言模型用于代码补全

BriefGPT - AI 论文速递 ·

Meta/Facebook发布并开源了Code Llama编程AI模型。他们现在推出了更强大的版本Code Llama 70B，该版本在5000亿个标记上进行了训练，并支持10万个上下文窗口。它可以理解代码结构，并用于多种编程语言中的算法、排序和搜索任务。还有经过微调的版本，如CodeLlama-70B-Instruct和CodeLlama-70B-Python。这些模型可以在开放许可下免费下载。

Meta推出性能更强大的编程AI Code Llama 70B版支持100K上下文

蓝点网 ·

本文介绍了代码生成的发展史和技术原理，包括GitHub copilot的起源和评估效果，pass@k度量的计算逻辑，Codex的训练全流程，以及微软GitHub copilot和Code Llama的训练流程、工作原理和性能。

代码生成的原理解析：从Codex、GitHub Copliot到CodeLlama、CodeGeex

结构之法算法之道 ·

稳定扩散和Code Llama是Workers AI的一部分，运行在Cloudflare全球网络的100多个城市。稳定扩散是一种生成图像的创新模型，Code Llama是一个强大的语言模型，优化了生成编程代码。Workers AI提供推理服务，为开发者提供更好的用户体验。

Workers AI 更新：稳定扩散、Code Llama + Workers AI 覆盖 100 个城市

The Cloudflare Blog ·

Code Llama 解读系列1-论文阅读

Yunfeng's Simple Blog ·

Meta推出了一款名为Code Llama的前沿技术，它是一款基于Llama 2构建的大型语言模型，用于生成和讨论代码。Code Llama是最先进的LLM之一，免费使用，有三种模型可供选择。Meta致力于推动AI的开放和创新，Code Llama的发布旨在促进新技术的开发。Code Llama有潜在的应用于开发效率、教育工具和跨行业支持。