当一张图像价值 1,024 x 1,024 个词:计算病理学案例研究
💡
原文中文,约400字,阅读约需1分钟。
📝
内容提要
本技术报告介绍了LongViT,一种能够以端到端方式处理十亿像素图像的视觉Transformer。通过将图像分割成补丁并进行线性投影,使用LongNet对极长序列进行建模,生成捕捉了短程和长程依赖关系的表示。实验结果表明,LongViT在癌症诊断和预后方面优于先前的方法。
🎯
关键要点
- 本技术报告介绍了LongViT,一种能够以端到端方式处理十亿像素图像的视觉Transformer。
- LongViT将十亿像素图像分割成数百万个补丁,并进行线性投影。
- 使用LongNet对极长序列进行建模,生成捕捉短程和长程依赖关系的表示。
- LongNet的线性计算复杂度和分布式算法克服了计算和内存的限制。
- LongViT应用于计算病理学领域,旨在进行癌症诊断和预后的十亿像素全切片图像。
- 实验结果表明,LongViT在癌症亚型分型和生存预测方面优于先前的最先进方法。
- 代码和模型将在指定的URL上提供。
🏷️
标签
➡️