subtitle
01
07
【转载】MapReduce之数据倾斜原因与解决 【转载】MapReduce之数据倾斜原因与解决
1 前言在大数据背景下, 数据倾斜是一个频发问题, 有时候我们可能会有疑问, 为什么一个处理几千万数据量的任务比一个处理几亿数据量的任务耗时还要长很多, 这里大概率是因为任务产生了数据倾斜. 在日常工作中, 数仓工程师一般可以比较好的处理倾
2022-01-07