基于注意力的机器学习方法用于数据压缩,具有保证的误差界限
原文中文,约500字,阅读约需1分钟。发表于: 。本研究针对科学应用中数据产生的指数级增长问题,提出了一种基于注意力的分层压缩方法,通过块级压缩结构捕捉数据块间的相关性及块内信息。该方法能够有效地捕捉时空和变量间的相关性,与目前最先进的SZ3方法相比,压缩比最高可达8倍,展示了其在多变量和单变量数据集上的优越性。
BLASTNet 2.0是一个包含744个全域样本的2.2TB数据集,用于解决三维高保真可压湍流流动模拟数据稀缺的问题。通过基准测试评估了49种不同的深度学习方法在三维超分辨率方面的性能,对科学成像、模拟、湍流模型和计算机视觉应用有所改进。数据已公开可下载。