文档的时间顺序
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
该文介绍了一种无监督方法,可用于对历史文件集进行时间排序。该方法使用非参数广义线性模型和模拟退火算法,有效捕捉词语使用的渐变变化,并获得最佳的文档时间顺序。该方法已在《美国国情咨文演讲》和 DEEDS 语料库上进行了测试,并显著改善了时间排序。这种无监督方法应能够对未标记的文档集进行时间排序。
🎯
关键要点
-
该文介绍了一种无监督方法,用于对历史文件集进行时间排序。
-
方法使用非参数广义线性模型和模拟退火算法,有效捕捉词语使用的渐变变化。
-
该方法已在《美国国情咨文演讲》和DEEDS语料库上进行了测试。
-
与随机排序的基线相比,方法显著改善了时间排序。
-
这种无监督方法能够对未标记的文档集进行时间排序。
➡️