💡 原文中文,约1400字,阅读约需4分钟。
📝

内容提要

该论文提出了一种新型神经网络HiTIN,用于层次文本分类。主要创新点是将类别层级树结构转换成新的树结构coding tree。通过GNN在coding tree上递归地获得节点的embedding,最后做pooling并经过线性层得到最终logits。结果表明,相比其他网络,本网络参数少且效果好。此外,论文提出了递归正则化等通用技巧。

🎯

关键要点

  • 该论文提出了一种新型神经网络HiTIN,用于层次文本分类。
  • 主要创新点是将类别层级树结构转换成新的树结构coding tree。
  • 通过GNN在coding tree上递归地获得节点的embedding,最后做pooling并经过线性层得到最终logits。
  • 结果表明,相比其他网络,本网络参数少且效果好。
  • 论文提出了递归正则化等通用技巧。
  • Coding tree的目标是使得在给定的深度下,structural entropy最小。
  • 作者设计了启发式算法CodIng tRee Construction Algorithm (CIRCA)来转换原始树。
  • 在层级分类中,亲子关系的类别应该更容易一起分类。
➡️

继续阅读