多源轨迹建模与分离的动态变分自编码器混合

💡 原文中文,约400字,阅读约需1分钟。
📝

内容提要

本文提出了一种名为混合动态变分自编码器(MixDVAE)的潜在变量生成模型,用于建模多个移动源组成的系统的动态。通过在单源数据集上预训练DVAE模型来捕捉源的动态,然后将多个预训练DVAE模型的实例集成到一个多源混合模型中,带有离散观测-源分配潜变量。实验结果表明,该方法在计算机视觉任务和音频处理任务上表现良好,并超过了几种基准方法。

🎯

关键要点

  • 提出了一种名为混合动态变分自编码器(MixDVAE)的潜在变量生成模型。

  • 该模型用于建模由多个移动源组成的系统的动态。

  • 通过在单源数据集上预训练DVAE模型来捕捉源的动态。

  • 将多个预训练DVAE模型的实例集成到一个多源混合模型中,带有离散观测-源分配潜变量。

  • 使用变分期望最大化算法估计离散的观测-源分配变量和连续DVAE变量的后验分布。

  • 展示了MixDVAE模型在多目标跟踪和单声道音频源分离任务上的多功能性。

  • 实验结果表明,该方法在这两个任务上表现良好,并超过了几种基准方法。

➡️

继续阅读