💡
原文英文,约500词,阅读约需2分钟。
📝
内容提要
人工智能正在改变医学,研究人员使用GatorTronGPT模型训练了一个大型语言模型,生成了合成的临床文本语料库,并用它来训练了一个基于BERT的模型GatorTron-S。GatorTron-S在临床自然语言理解任务中表现出了出色的性能,使用了更少的数据。合成数据解决了数据量大和医学数据有限的问题,同时符合医疗隐私法规。这项工作展示了人工智能在医学领域的进展,是新人工智能技术的一个例子。
🎯
关键要点
- 人工智能正在改变医学,越来越多地应用于临床任务。
- GatorTronGPT是一个在佛罗里达大学HiPerGator AI超级计算机上训练的生成语言模型。
- 研究团队使用了2770亿个词的庞大语料库进行训练,包括820亿个去标识化的临床笔记和195亿个英语文本。
- GatorTronGPT生成了超过200亿个合成临床文本的语料库,模拟真实医生书写的临床笔记。
- 合成数据用于训练基于BERT的模型GatorTron-S,表现出色,超越了原始BERT模型GatorTron-OG的记录。
- GatorTron-S在临床自然语言理解任务中使用了更少的数据。
- 合成数据解决了医学数据有限和数据隐私合规的问题。
- GatorTronGPT的工作展示了新人工智能技术在医学领域的进展。
- 该项目是佛罗里达大学与NVIDIA于2020年宣布的合作成果,旨在建立世界上最快的学术AI超级计算机。
- HiPerGator超级计算机将推动医学科学和其他学科的更多创新。
➡️