阿里云云栖号 ·

面向垂直领域的知识预训练语言模型

💡 原文中文，约4100字，阅读约需10分钟。

📝

内容提要

阿里云PAI与华东师范大学合作在EMNLP2023发表了关于垂直领域预训练语言模型的论文。他们提出了一种通过双曲空间和对比学习来增强上下文语言表示的框架，解决了垂直领域知识稀疏的问题。模型在金融和医疗领域的下游任务上表现良好。

🎯

关键要点

阿里云PAI与华东师范大学在EMNLP2023上发表了关于垂直领域预训练语言模型的论文。
提出了一种通过双曲空间和对比学习增强上下文语言表示的框架。
解决了垂直领域知识稀疏的问题，模型在金融和医疗领域的下游任务上表现良好。
知识增强预训练语言模型（KEPLM）通过注入知识事实提高NLP任务性能，但在垂直领域面临全局稀疏问题。
研究发现垂直领域知识图谱具有全局稀疏和局部稠密的特点。
KANGAROO模型通过双曲空间学习和对比学习来增强语义表示。
模型包括Hyperbolic Knowledge-aware Aggregator和Multi-Level Knowledge-aware Augmenter两个模块。
Hyperbolic Knowledge-aware Aggregator用于补充全局语义稀疏，Multi-Level Knowledge-aware Augmenter用于纠正全局稀疏性问题。
模型的损失函数包含token级别的MLM掩码任务和对比学习任务。
KANGAROO模型在金融和医疗领域的全数据量和少样本数据量场景中进行了评测。
KANGAROO算法的源代码将贡献于EasyNLP开源框架，供NLP从业人员和研究者使用。

🏷️

继续阅读

世界银行集团如何利用Databricks通过共享知识消除贫困
世界银行集团通过Databricks构建统一的数据和AI平台，整合结构化与非结构化数据，提升决策效率。该平台支持自然语言查询，简化数据检索，推动数据民主化...
JetBrains 在 AI 编程领域保持独立，而其他公司则纷纷选边
JetBrains 自认为是唯一独立的 AI 编程工具供应商，强调产品中立性。公司未融资，盈利良好，拥有 1600 万用户。JetBrains Centr...
JFrog报告回顾了供应链安全领域动荡的一年
2025年，软件供应链面临前所未有的安全挑战，AI的快速发展扩大了攻击面。JFrog报告显示，恶意活动激增451%。尽管97%的企业声称有治理措施，但实际...
全新生图模型 Anima V1 发布：专注动漫风格的图像生成；MemLens 多模态长程记忆评估数据集：涵盖跨会话图文推理与知识更新机制
Anima V1 是 CircleStone Labs 于 2026 年推出的动漫风格图像生成模型，支持通过文本描述快速生成角色立绘和插画，用户可在 Gr...
HBO Max在全球体育内容流媒体领域处于领先地位
根据Gracenote分析，体育节目在全球SVOD平台中迅速增长，目前占比5%。HBO Max拥有最大体育节目库，占35%。预计到2026年，主要平台的体...
告别 GPU 独占时代：用 HAMi 实现训练推理一体化——博维智慧 GPU 虚拟化实战
博维智慧科技通过Kubernetes和HAMi实现科研实验室GPU资源的高效管理，提升了70%的GPU利用率。该方案支持训练与推理的物理隔离，优化显存使用...

面向垂直领域的知识预训练语言模型

内容提要

关键要点

标签

继续阅读