本研究提出了一种新方法,将大型语言模型的摘要生成与主题建模相结合,以解决源代码理解中的主题建模问题。实验结果表明,该方法生成的摘要能够提供更具可解释性的代码结构表示,具有广泛的应用潜力。
本文介绍了CodeQA数据集,包含119,778个Java和70,085个Python问题-答案对,旨在促进源代码理解。通过语法和语义分析生成问题-答案对,并展示了神经网络实验结果,为代码问题回答研究提供了基准。
完成下面两步后,将自动完成登录并继续当前操作。