LUMA: 一个用于学习不确定和多模态数据的基准数据集

📝

内容提要

多模态深度学习通过整合文本、图像、音频和视频等多元信息源增强决策能力。为了开发可靠的多模态方法,了解不确定性如何影响这些模型至关重要。我们介绍了 LUMA 数据集,它是一个独特的基准数据集,其中包含来自 50 个类别的音频、图像和文本数据,用于从不确定和多模态数据中学习。该数据集扩展了著名的 CIFAR 10/100 数据集,其中包含从三个音频语料库中提取的音频样本,以及使用...

🏷️

标签

➡️

继续阅读