分类
Articles

ClickHouse内幕(3)Join & In执行流程

ClickHouse在处理对分布式表的查询时,采用scatter-gather的模式。首先会将查询拆分成对本地表的查询,这里称之为“部分查询”,然后在第一个接收到查询的节点将部分查询结果进行合并。

那么对于向Join和In(包含子查询)这样的包含多个分布式表的查询,ClickHouse如何处理呢?

PS:woo.student woo.score为分布式表,以“_l”结尾的表为本地表

Join

select id, name ,score from woo.student as la_003 join woo.score as b_003 on student.id=score.id;

1. 每个分片分发请求,以计算左表每个本地表的Join结果(展开第一个分布式表)

select id, name ,score from woo.student_l as la_003 join woo.score as b_003 on student_l.id=score.id;

2. 当分片收到1中的sql请求后,需要计算右表结果,所以向每个分片分发请求(展开第二个分布式表)

SELECT id FROM woo.student_l AS c_006

假如总共100的分片,需要100*100次部分查询

Global Join

select id, name ,score from woo.student as la_004 global join woo.score as b_004 on student.id=score.id;

1. 首先计算右表的结果( 展开第一个分布式表)

向每个分片分发请求

SELECT id, score FROM woo.score_l

合并结果成一张临时表 b_004

2. 将临时表b_004下发到所有分片计算部分Join结果(展开第二个分布式表)

SELECT id, name, score FROM woo.student_l AS la_004 GLOBAL ALL INNER JOIN b_004 AS b_004 ON student_l.id = b_004.id

3. 合并2中的结果,为最终结果

假如总共100的分片,需要2 * 100次部分查询

Colocate Join

假设woo.student和woo.score 两个表严格按照id字段将数据hash散列到不同的节点上,那么Join可以采用一种非常高效的方式,colocate Join(本地Join),sql中将右表直接用本地表代替,具体如下:

select id, name ,score from woo.student as la_003 join woo.score_l as b_003 on student.id=score.id;

那么执行流程将为:

1. 展开左表,计算部分结果

select id, name ,score from woo.student_1 as la_003 join woo.score_l as b_003 on student.id=score.id;

2. 合并部分结果,即为最终结果

In

select sum(score) from woo.score where id in (select id from woo.student as c_006);

1. 向每个分片分发请求,以计算woo.score的每个本地表的部分查询结果

SELECT sum(score) FROM woo.score_l WHERE id IN ((SELECT id FROM woo.student AS c_006) AS _subquery6)

2. 当分片收到1中的sql请求后,需要计算子查询的结果,所以向每个分片分发请求(展开第二个分布式表)

SELECT id FROM woo.student_l AS c_006

假如总共100的分片,需要100*100次部分查询

GLOBAL IN

select sum(score) from woo.score where id global in (select id from woo.student as c_002) ;

1. 首先计算子查询的结果,并存储为临时表 _subquery3,此时展开第一个分布式表

向每个分片分发请求

SELECT id FROM woo.student_l AS c_002

合并结果成一张临时表 _subquery3

2. 将临时表_subquery3发到所有分片计算部分结果,此时展开第二个分布式表

SELECT sum(score) FROM woo.score_l WHERE id GLOBAL IN (_subquery3)

3. 合并2中的结果,为最终结果

假如总共100的分片,需要2*100次部分查询

小结

1. 对于in与join查询会进行指数级的部分查询分发,所以建议使用global in和global join。

2. 对于Join来说会优先计算右表,右表数据合并后有一个完全的数据集,所以查询建议将小标放到右边。

3. 对于需要Join两个大表的情况,可以通过导入数据时将两个表按照Join条件中的列散列数据,然后通过5中的sql来触发colocate join机制

ClickHouse因为两层的查询执行引擎并且没有shuffle机制,导致没有完整distributed_join机制,所以Join大表性能低下。

本作品采用 知识共享署名 4.0 国际许可协议 进行许可, 转载时请注明原文链接。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注