挖掘概念模型中的频繁结构
💡
原文中文,约200字,阅读约需1分钟。
📝
内容提要
本文首次给出了代码概括模型所发现的模式的形式化定义,并提出了一种推断正则语言文法的声学算法。对代码2vec和代码2seq进行了评估并发现提取出的模式受限于局部和语法代码结构并缺乏语义含义。基于这些发现,本文介绍了正式定义模式的两个新方法:评估健壮性和提高代码概括模型的准确性。
🎯
关键要点
-
首次给出了代码概括模型所发现的模式的形式化定义。
-
提出了一种推断正则语言文法的声学算法。
-
对代码2vec和代码2seq进行了评估,发现提取出的模式受限于局部和语法代码结构。
-
提取的模式缺乏语义含义。
-
介绍了正式定义模式的两个新方法:评估健壮性和提高代码概括模型的准确性。
➡️