当一张图像价值 1,024 x 1,024 个词:计算病理学案例研究

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本技术报告介绍了LongViT,一种能够以端到端方式处理十亿像素图像的视觉Transformer。通过将图像分割成补丁并进行线性投影,使用LongNet对极长序列进行建模,生成捕捉了短程和长程依赖关系的表示。实验结果表明,LongViT在癌症诊断和预后方面优于先前的方法。

🎯

关键要点

  • 本技术报告介绍了LongViT,一种能够以端到端方式处理十亿像素图像的视觉Transformer。
  • LongViT将十亿像素图像分割成数百万个补丁,并进行线性投影。
  • 使用LongNet对极长序列进行建模,生成捕捉短程和长程依赖关系的表示。
  • LongNet的线性计算复杂度和分布式算法克服了计算和内存的限制。
  • LongViT应用于计算病理学领域,旨在进行癌症诊断和预后的十亿像素全切片图像。
  • 实验结果表明,LongViT在癌症亚型分型和生存预测方面优于先前的最先进方法。
  • 代码和模型将在指定的URL上提供。
➡️

继续阅读