CodeLL:支持数据和代码语言模型共同演进的终身学习数据集
💡
原文中文,约300字,阅读约需1分钟。
📝
内容提要
CodeNet是一个大规模数据集,旨在教授AI编码技能以提高软件开发效率。该数据集包含超过14百万个代码样例和约55种不同编程语言中的5亿行代码。CodeNet还提供了丰富的高质量注释,包括代码相似性和分类、代码翻译以及代码性能改进技术等。这为AI和软件工程交叉领域提供了研究机会。
🎯
关键要点
- CodeNet是一个大规模数据集,旨在教授AI编码技能。
- 该数据集包含超过14百万个代码样例和约55种不同编程语言中的5亿行代码。
- CodeNet提供丰富的高质量注释,包括代码相似性和分类、代码翻译以及代码性能改进技术。
- CodeNet为AI和软件工程交叉领域提供了研究机会。
➡️