在问答系统中使用弱监督和数据增强

💡 原文中文,约200字,阅读约需1分钟。
📝

内容提要

研发新型数据增强框架,提高 PrivacyQA 基准测试水平 10% F1,实现 50% 新水平。

🎯

关键要点

  • 开发了一种新型数据增强框架。
  • 集成检索模型和多个预训练语言模型及去噪防护。
  • 捕获未标记的策略文件中的相关文本段。
  • 扩展训练集中的正面示例。
  • 在 PrivacyQA 基准测试中将现有水平提高了 10% F1。
  • 实现了 50% 的新水平。
  • F1 是一种评估二元分类器准确性的综合度量。
➡️

继续阅读