该论文介绍了 NT-Java-1.1B,这是一个基于 StarCoderBase-1.1B 构建的开源专用编码语言模型,专门用于 Java 编程任务。NT-Java-1.1B 在 MultiPL-E Java 代码基准测试中实现了最先进的性能,超越了其基础模型和大多数类似大小的其他模型。通过开发小型 Java 代码模型 NT-Java-1.1B...
本文介绍了使用开源语言模型StarCoder创建个性化编程助手的方法,包括训练对话模型的数据集和屏蔽用户标签以提高模型效果。同时,探讨了评估编程助手的方法和实验结果。作者感谢Nicolas Patry、Olivier Dehaene、Omar Sanseviero和Abubakar Abid等人的帮助和支持。
StarCoder是一个大型代码语言模型,由Hugging Face和ServiceNow联合开发,训练了超过1万亿个标记,可用于自动完成代码、修改代码、自然语言解释代码片段等。该模型可以处理超过8,000个标记的上下文长度,是目前最大的开放式LLM之一。在多种基准测试中,StarCoder表现出色,超过了其他开放式LLM,包括OpenAI的code-cushman-001模型。该模型已公开发布,并提供了一系列资源和演示。
完成下面两步后,将自动完成登录并继续当前操作。