微软Azure用户有了令人兴奋的新发展,数据管理能力迈上了新台阶。Atlas Data Federation和Atlas Online Archive现在在Azure上普遍可用,为基于Azure的数据解决方案带来了高效的归档解决方案的新时代。
Atlas Data Federation (ADF)发布了一种名为Online Shredder的新方法,该方法将BSON格式的数据转换为固定模式的列式Parquet格式。该方法使用定义和重复级别来维护元数据,以消除剪切值的歧义。新方法提高了Parquet写入器的效率,吞吐量提高了2倍,没有负载的性能变差。
Atlas Data Federation (ADF)开发了一种名为Online Shredder的新方法,可以将文档流一次性剪切成列格式,并并行构建模式。该方法提高了parquet-writer的效率,吞吐量提高了2倍,没有任何工作负载的性能变差。技术挑战是支持MongoDB的灵活模式,并保持无损parquet发射的正确信息。剪切过程使用定义和重复级别来消除剪切值的歧义,并使用惰性同步技术来回填所需的def-levels。该工作为parquet-emission支持奠定了坚实的基础,并将最大客户的parquet-writing吞吐量提高了一倍。
MongoDB发布了一种改进的BSON-to-Parquet writer,用于Atlas Data Federation(ADF),将数据从BSON格式转换为固定模式、列式Parquet格式。新方法引入了一种在线Shredder算法,可以在单个传递中将文档流剪切成列式格式,并同时构建模式。新方法使用了apache-go Parquet writer,并提高了Parquet writer的CPU和内存使用效率。在线Shredder算法使MongoDB能够将文档流剪切成列式格式,并同时构建模式。
完成下面两步后,将自动完成登录并继续当前操作。