小红花·文摘

本研究开发了多语言科学文献相似度测量模型，并推出了包含103种语言的OpenMSD数据集，以帮助研究人员高效查找相关论文。通过预训练科学语言模型和生成英语摘要，提升了非英语论文的表现。此外，研究评估了大型语言模型在生成参考文献和科学知识理解方面的能力，并提出了SciKnowEval评估框架，以优化大型语言模型在科学研究中的应用。