StRuCom:一套新的俄语结构化代码注释数据集

📝

内容提要

本研究针对现有机器学习模型在生成俄语代码注释时的低效问题,提出了首个大规模的专用数据集StRuCom(包含153K个示例)。该数据集结合了来源于俄语GitHub仓库的人类编写的注释与合成生成的注释,确保符合多种编程语言的标准,并在对Qwen2.5-Coder模型进行微调时,显著提高了模型的性能。

🏷️

标签

➡️

继续阅读