基于分层区域的多实例学习中的 Transformer

我们提出了一种基于 Transformer 的多例学习方法，用区域视觉 Transformer 自注意机制替代传统的学习注意机制，通过融合区域块信息来预测整张幻灯片，并展示了如何在不同距离级别上分层处理特征。为了提高预测准确性，尤其是对于具有小区域形态特征的数据集，我们介绍了一种在推断期间将图像处理集中于高注意区域的方法。我们的方法能够显著提高两个组织病理学数据集上的性能，并指出了进一步研究的有希望的方向。

本文介绍了一种基于Transformer的多例学习方法，使用区域视觉Transformer自注意机制来预测整张幻灯片，并处理不同距离级别上的特征。作者还提出了一种在推断期间将图像处理集中于高注意区域的方法，以提高预测准确性。实验证明该方法在两个组织病理学数据集上性能显著提高，并指出了进一步研究的有希望的方向。

Transformer 区域视觉多例学习组织病理学自注意机制