小红花·文摘

生成型AI应用构建者必须解决新的RAG复杂性

The New Stack ·

该文章介绍了一种填补综合性人力资源任务基准的方法，通过提取领域特定知识和使用技能-职业图来生成上下文，该基准可以满足各种人力资源任务的需求。实验证明，该基准的学生模型性能接近或优于教师模型，并在零-shot和弱监督方式下探索了技能提取和简历-职位描述匹配的实用性。数据集和代码已发布以促进进一步研究和应用。

在职业市场领域利用大型语言模型重新思考技能提取

BriefGPT - AI 论文速递 ·

本文提出了新的跨语言生物医学实体链接任务和基准测试，并研究了单语和多语言语言模型在该任务中的能力。同时解决了资源丰富语言向资源贫乏语言传递领域特定知识的挑战，并提出并评估了跨语言传递方法。研究结果表明，领域特定传递方法在所有目标语言中都有持续提高，有时可高达20个Precision@1点，无需目标语言具有领域内知识和并行数据。

KBioXLM：一种基于知识锚定的多语言预训练生物医学语言模型

BriefGPT - AI 论文速递 ·

本文提出了一个新的跨语言生物医学实体链接任务，并建立了一个涵盖10种语言的基准测试。研究了标准、知识增强的单语和多语言语言模型在标准英语生物医学实体链接任务之外的能力，并解决了把资源丰富的语言中的领域特定知识传递给资源贫乏的语言的挑战。提出并评估了一系列的跨语言传递方法，研究表明，本文提出的领域特定传递方法在所有目标语言中均获得了持续的提高，有时可高达20个Precision@1点，而无需目标语言具有领域内的知识和对应的并行数据。

结合语言模型的专业领域研究：一种多彩的方法

BriefGPT - AI 论文速递 ·