数仓性能调优:大宽表关联MERGE性能优化

💡 原文中文,约64800字,阅读约需155分钟。
📝

内容提要

本文讨论了大宽表关联MERGE性能优化的问题,通过拆分MERGE语句为UPDATE和INSERT两个独立的结果集插入目标表,优化了执行计划,提升了性能。

🎯

关键要点

  • 本文讨论了大宽表关联MERGE性能优化的问题。
  • MERGE语句执行耗时长达2034秒。
  • 通过拆分MERGE语句为UPDATE和INSERT两个独立的结果集插入目标表,优化了执行计划。
  • 分析执行计划发现表sdifin.hah_ae_line_sr_t_02_8663和stgfin.dlt_hah_ae_line_sr_t_02_8663都是3+亿数据的大宽表。
  • 重分布的数据量也是3+亿数据,单字段宽度达30K。
  • MERGE之前的重分布耗时达到800秒。
➡️

继续阅读