💡
原文中文,约1400字,阅读约需4分钟。
📝
内容提要
该论文提出了一种新型神经网络HiTIN,用于层次文本分类。主要创新点是将类别层级树结构转换成新的树结构coding tree。通过GNN在coding tree上递归地获得节点的embedding,最后做pooling并经过线性层得到最终logits。结果表明,相比其他网络,本网络参数少且效果好。此外,论文提出了递归正则化等通用技巧。
🎯
关键要点
- 该论文提出了一种新型神经网络HiTIN,用于层次文本分类。
- 主要创新点是将类别层级树结构转换成新的树结构coding tree。
- 通过GNN在coding tree上递归地获得节点的embedding,最后做pooling并经过线性层得到最终logits。
- 结果表明,相比其他网络,本网络参数少且效果好。
- 论文提出了递归正则化等通用技巧。
- Coding tree的目标是使得在给定的深度下,structural entropy最小。
- 作者设计了启发式算法CodIng tRee Construction Algorithm (CIRCA)来转换原始树。
- 在层级分类中,亲子关系的类别应该更容易一起分类。
➡️