小红花·文摘

本研究探讨了大型语言模型（LLMs）在神经网络超参数优化中的应用。通过微调的Code Llama，我们的方法在生成超参数建议方面高效且具有竞争力，显著降低了计算开销，并在根均方误差（RMSE）上表现优异，展示了LLMs在快速实验中的潜力。

Optuna vs Code Llama: Are Large Language Models a New Paradigm for Hyperparameter Tuning?

BriefGPT - AI 论文速递 ·

发布了基于 Llama 2 的开源代码语言模型 Code Llama，具备先进的性能和编程任务能力。研究表明，通过生成测试用例可提升程序质量，CodeT5+ 模型在代码生成任务中表现优异。DeepSeek-Coder 模型在多个基准测试中超越现有闭源模型，并支持商业应用。

花岗岩代码模型：一系列针对代码智能的开放基础模型

BriefGPT - AI 论文速递 ·

Meta/Facebook发布并开源了Code Llama编程AI模型。他们现在推出了更强大的版本Code Llama 70B，该版本在5000亿个标记上进行了训练，并支持10万个上下文窗口。它可以理解代码结构，并用于多种编程语言中的算法、排序和搜索任务。还有经过微调的版本，如CodeLlama-70B-Instruct和CodeLlama-70B-Python。这些模型可以在开放许可下免费下载。

Meta推出性能更强大的编程AI Code Llama 70B版支持100K上下文

蓝点网 ·

本文介绍了代码生成的发展史和技术原理，包括GitHub copilot的起源和评估效果，pass@k度量的计算逻辑，Codex的训练全流程，以及微软GitHub copilot和Code Llama的训练流程、工作原理和性能。

代码生成的原理解析：从Codex、GitHub Copliot到CodeLlama、CodeGeex

结构之法算法之道 ·

稳定扩散和Code Llama是Workers AI的一部分，运行在Cloudflare全球网络的100多个城市。稳定扩散是一种生成图像的创新模型，Code Llama是一个强大的语言模型，优化了生成编程代码。Workers AI提供推理服务，为开发者提供更好的用户体验。

Workers AI 更新：稳定扩散、Code Llama + Workers AI 覆盖 100 个城市

The Cloudflare Blog ·

开源日报 0827 | Discourse: 开源社区应用

开源服务指南 ·

Code Llama 解读系列1-论文阅读

Yunfeng's Simple Blog ·

Meta推出了一款名为Code Llama的前沿技术，它是一款基于Llama 2构建的大型语言模型，用于生成和讨论代码。Code Llama是最先进的LLM之一，免费使用，有三种模型可供选择。Meta致力于推动AI的开放和创新，Code Llama的发布旨在促进新技术的开发。Code Llama有潜在的应用于开发效率、教育工具和跨行业支持。