云计算百科
云计算领域专业知识百科平台

标签:大数据

分库分表跨库JOIN性能优化

文章浏览阅读372次,点赞14次,收藏4次。分库分表场景下跨库JOIN的性能优化方案可分为三个维度:设计优化方面,采用全局表冗余、字段冗余和ER分片策略;数据管...

阅读(6)

Spark的累加器(Accumulator)

文章浏览阅读55次。摘要:PySpark累加器是用于分布式计算中安全聚合数据的共享变量,支持数值型和集合型内置累加器,也可通过继承AccumulatorV2类实...

阅读(6)

【数据资产】企业级数据资产管理解决方案

文章浏览阅读763次,点赞18次,收藏10次。企业级数据资产管理解决方案通过构建覆盖数据全生命周期的体系化框架,助力企业数字化转型。核心组件包括数据治理框架、质...

阅读(7)