该研究提出了一种使用自然语言处理技术的新方法,针对未知类别的科学文献进行文本分类。研究利用预训练的语言模型从 ArXiv 数据集的摘要中提取有意义的表示,并使用 K-Means 算法进行文本分类。结果表明,该方法比传统的 arXiv 标签系统更有效地捕捉主题信息,为科学研究文献提供了更好的导航和推荐系统的潜力。
正在访问的资源需要验证您是否真人。
或在微信中搜索公众号“小红花技术领袖”并关注
第二步:在公众号对话中发送验证码: