月度归档: 2020年6月

  • 高性能编程

    在大量数据处理的场景下,对于程序要求极致的性能,本文尝试总结针对目前硬件特性的一些高效编程的方式

  • ORC字典实现

    本文分析ORC中字典的实现

  • Presto兼容Hive语法语义的一些改动

    本文介绍Presto的语法和语义向Hive兼容的一些改造工作。

  • Druid存储结构

    Apache Druid是一款优秀的OLAP引擎,众所周知数据存储格式对一款存储系统来说是最核心的组件,Druid的数据格式是自定义的,以此保证了在海量数据下的亚秒级查询。本文深入分析Druid V1版本数据存储格式,包括索引结构和数据在磁盘中的存储方式。在阅读本文之前希望您对Druid和数据存储有简单了解。

  • KYLIN、DRUID、CLICKHOUSE核心技术对比

    KYLIN、DRUID、CLICKHOUSE是目前主流的OLAP引擎,本文尝试从数据模型和索引结构两个角度,分析这几个引擎的核心技术,并做简单对比。在阅读本文之前希望能对KYLIN、DRUID、CLICKHOUSE有所理解。

  • Kylin数据模型

    Apache Kylin是一款国人主导的优秀的OLAP引擎,工作中对Kylin有大规模的使用,尝试总结Kylin核心技术,本文是第一篇,偏向数据模型方面。