本文主要分享了作者在蚂蚁集团高管数据链路改造升级过程中,针对去重Cube的优化实践。 引言 SQL作为目前最通用的数据库查询语言,其功能和特性复杂度远不止大家常用的“SELECT * FROM tbl”这样简单,一段好的SQL和差的SQL,其性能可能有几十乃至上千倍的差距。
记录一下此前未用过的CUBE和ROLLUP功能,便于日后查阅使用。 1、 Rollup 的处理机制是在完成基础数据汇总后,按从右至左的顺序,依次移除字段列表末尾的一个字段,对剩余字段进行分组聚合,并将生成的小计结果写入结果表,被移除字段的位置以 null 值填充。