Blink 有何特别之处?菜鸟供应链场景最佳实践(3)

除了上述几点优化,Blink SQL 模式还在尝试引入 SideInput、Partitioned ALL Cache 等优化方案,相信在随后开源的 Blink 版本中,,维表关联的性能会越来越好。 [好文分享:www.11jj.com]

下面是一张来自 Flink Committer 云邪 异步查询的流程图,供理解与同步请求的差异。 [原创文章:www.11jj.com]

Blink 有何特别之处?菜鸟供应链场景最佳实践(3)

数据倾斜

无数据不倾斜,我们在实时数仓建设过程中,也当然会遇到数据倾斜问题。在统计卖家的单量时,有些卖家单量大,有些卖家单量小,单量超大的卖家,就会产生数据倾斜;在统计行业的单量时,有些行业单量大,有些行业单量小,单量超大的行业,就会产生数据倾斜;在统计货品的库存流水情况时,有些货品库存流水频繁,一些货品库存流水较少,库存流水超频繁的货品就会产生数据倾斜……

我们应该如何处理数据倾斜问题呢?以统计卖家的单量为例,以前我们会先把订单这个 Key 作 Hash,先针对 Hash 之后的值做一次去重的聚合操作,再在此基础上,再做一次针对原 Key 去重的聚合操作。两次类似的聚合操作,导致代码写起来比较复杂,体力劳动比较多。

2017年,我们的实时数据开始全面切换到 Blink 上,Blink 在数据倾斜这块,又给我们提供了什么的方案呢?Blink 给出的答案是:MiniBatch/MicroBatch+LocalGlobal+PartialFinal。

MiniBatch/MicroBatch,可以实现微批处理,进而减少对 State 的访问,提升吞吐。因为微批处理会导致一定的延迟,最好结合 Blink 提供的允许延迟的相关参数来使用。

LocalGlobal,分为 Local 和 Global 两个阶段,有点类似 MapReduce 中的Combine 和 Reduce 两个阶段。LocalGlobal 可以很好地处理非去重类的聚合操作,但对 Count Distinct 的优化效果一般,因为在 Local 阶段,可能 Distinct Key的去重率并不会很高,进而导致后续的 Global 阶段,仍然会有热点。

PartialFinal,可以很好地解决 Count Distinct 带来的数据倾斜问题。PartialFinal 可以将 Distinct Key 自动打散,先聚合一次,在此基础上,再聚合一次,从而实现打散热点的作用。PartialFinal 跟手动 Hash 再聚合两次的效果一致,通过 Blink 提供的 PartialFinal 参数,可以自动实现,不再需要人为手工编写 Hash 再聚合两次的代码。

由上可以看出,Blink 在数据倾斜的处理上,已经实现了自动化,以前人为编写的打散热点方案,现在几个参数就能全部搞定,大大提升了代码的编写效率。

自媒体 微信号:11jj 扫描二维码关注公众号
爱八卦,爱爆料。

小编推荐

  1. 1

    新学期新计划400字左右作文(新学期新计划作文800字)

    大家好,小美今天来为大家解答新学期新计划400字左右作文以下问题,新学期新计划作文800字很多人还不知道,现在让我们一起来看看吧!1、篇一:

  2. 2

    水生木金生水(水生木,木生金)

    大家好,小豪今天来为大家解答水生木金生水以下问题,水生木,木生金很多人还不知道,现在让我们一起来看看吧!1、金生水。2、金生水:金凝结

  3. 3

    【集团动态】阅读悦美·共沐书香——银川七幼开展读书节系列活动之教职工读书分享会

    阅读悦美·共沐书香银川七幼念书节系列运动之教职工念书分享会最丽人间四月天,书香盈盈润内心。为培养师幼阅读习惯,以书香滋润校园,2024年

  4. 4

    【媒体聚焦】多地纪检监察机关加大对老旧小区改造工作的监督力度——解决居民关切的实际问题(基层治理新实践)

    习近平总书记指出:“老旧小区革新是城市更新的一个重点,也是一项民生工程,既要保留汗青记忆和特色风貌,又要解决居民关切的实际问题。”

  5. 5

    spss信度效度分析步骤(spss信度效度分析操作步骤)

    大家好,小丽今天来为大家解答spss信度效度分析步骤以下问题,spss信度效度分析操作步骤很多人还不知道,现在让我们一起来看看吧!1、打开SPSS软

  6. 6

    广西气象台海洋天气(广西海洋天气预报)

    大家好,小豪今天来为大家解答广西气象台海洋天气以下问题,广西海洋天气预报很多人还不知道,现在让我们一起来看看吧!1、广西气象台2022年

  7. 7

    春天荨麻疹怎样预防和治疗

    春季光降,万象更新,也是各类皮肤疾病,包罗荨麻疹的高发季候。对此,公家需接纳一系列预防办法,并正确认识治疗方式,以确保健康渡过这段

  8. 8

    抓经济促发展—那诺乡以鱼增收,搅活乡村振兴“春水”

    为有效盘活水库资源,促进村庄旅行财富成长,络续强大村集体经济,实现“以鱼清水、以鱼养水、以鱼增收”,那诺乡随机应变,鞭策抓经

Copyright 2024.依依自媒体,让大家了解更多图文资讯!