月度归档: 2020年6月
-
高性能编程
在大量数据处理的场景下,对于程序要求极致的性能,本文尝试总结针对目前硬件特性的一些高效编程的方式
-
ORC字典实现
本文分析ORC中字典的实现
-
Presto兼容Hive语法语义的一些改动
本文介绍Presto的语法和语义向Hive兼容的一些改造工作。
-
Druid存储结构
Apache Druid是一款优秀的OLAP引擎,众所周知数据存储格式对一款存储系统来说是最核心的组件,Druid的数据格式是自定义的,以此保证了在海量数据下的亚秒级查询。本文深入分析Druid V1版本数据存储格式,包括索引结构和数据在磁盘中的存储方式。在阅读本文之前希望您对Druid和数据存储有简单了解。
-
KYLIN、DRUID、CLICKHOUSE核心技术对比
KYLIN、DRUID、CLICKHOUSE是目前主流的OLAP引擎,本文尝试从数据模型和索引结构两个角度,分析这几个引擎的核心技术,并做简单对比。在阅读本文之前希望能对KYLIN、DRUID、CLICKHOUSE有所理解。
-
Kylin数据模型
Apache Kylin是一款国人主导的优秀的OLAP引擎,工作中对Kylin有大规模的使用,尝试总结Kylin核心技术,本文是第一篇,偏向数据模型方面。