多跳图变换网络用于 3D 人体姿势估计

介绍了一个用于视频中 2D 到 3D 人体姿势估计的多跳图变换网络，通过利用多头自注意力和多跳图卷积网络的优势以捕获时空依赖关系和处理远距离交互，提出了一个模型架构来实现准确的全局和局部依赖关系捕捉以及处理所需的空间细节，实验结果表明其有效性和泛化能力。

该文章介绍了一个用于视频中2D到3D人体姿势估计的网络模型，利用多头自注意力和多跳图卷积网络捕获时空依赖关系和处理远距离交互。实验结果表明该模型能够准确捕捉全局和局部依赖关系，并处理空间细节。