人工直觉:科学摘要的高效分类
原文中文,约400字,阅读约需1分钟。发表于: 。通过使用大型语言模型,我们开发了一种新方法来生成并适当分配粗略的领域特定标签,以实现对短科学文本(如奖项或出版物摘要)的粗略分类,从而帮助自动化处理这一相对困难的任务。
本研究提出了Fine-tuned DistilBERT方法,通过减小BERT模型尺寸和提升速度,在生物医学文本分类上证明了其有效性。使用DistilBERT模型在大规模语料库上进行预训练,结果超过传统方法。目标是将该模型应用于不同研究行业。
通过使用大型语言模型,我们开发了一种新方法来生成并适当分配粗略的领域特定标签,以实现对短科学文本(如奖项或出版物摘要)的粗略分类,从而帮助自动化处理这一相对困难的任务。
本研究提出了Fine-tuned DistilBERT方法,通过减小BERT模型尺寸和提升速度,在生物医学文本分类上证明了其有效性。使用DistilBERT模型在大规模语料库上进行预训练,结果超过传统方法。目标是将该模型应用于不同研究行业。