基于期刊影响指标的生物医学领域适应的预训练数据选择

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

本研究通过特定的科学论文质量指标优化预训练数据集,提高生物医学领域模型表现。使用期刊影响指标筛选数据不有效,但使用较少的摘要进行预训练不会显著降低模型性能,呈现新的预训练策略。

🎯

关键要点

  • 本研究探索通过特定的科学论文质量指标优化预训练数据集。
  • 研究旨在提高模型在生物医学领域的表现。
  • 使用期刊影响指标进行数据筛选并不有效。
  • 使用较少的摘要进行预训练不会显著降低模型性能。
  • 提出了一种新的预训练策略。
➡️

继续阅读