文档的时间顺序

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

该文介绍了一种无监督方法,可用于对历史文件集进行时间排序。该方法使用非参数广义线性模型和模拟退火算法,有效捕捉词语使用的渐变变化,并获得最佳的文档时间顺序。该方法已在《美国国情咨文演讲》和 DEEDS 语料库上进行了测试,并显著改善了时间排序。这种无监督方法应能够对未标记的文档集进行时间排序。

🎯

关键要点

  • 该文介绍了一种无监督方法,用于对历史文件集进行时间排序。

  • 方法使用非参数广义线性模型和模拟退火算法,有效捕捉词语使用的渐变变化。

  • 该方法已在《美国国情咨文演讲》和DEEDS语料库上进行了测试。

  • 与随机排序的基线相比,方法显著改善了时间排序。

  • 这种无监督方法能够对未标记的文档集进行时间排序。

➡️

继续阅读