分类
uncategorized

ClickHouse 2020 RoadMap

Clickhouse 2020 RoadMap,文档为俄文,翻译自 Google Translate

分类
uncategorized

JDK DNS解析策略

应开发内网命名服务的需求,需要调研Java是如何使用DNS的。以下文字是调研的一些结果,主要关注本地缓存、过期时间、多条A记录的选择策略以及如何自定义解析规则等方面。调研对象为JDK8。

分类
uncategorized

ORC数据格式 – 字典实现

本文分析ORC中字典的实现

分类
uncategorized

Presto兼容Hive语法语义实践

本文介绍Presto的语法和语义向Hive兼容的一些改造工作。

分类
uncategorized

Druid存储结构

Apache Druid是一款优秀的OLAP引擎,众所周知数据存储格式对一款存储系统来说是最核心的组件,Druid的数据格式是自定义的,以此保证了在海量数据下的亚秒级查询。本文深入分析Druid V1版本数据存储格式,包括索引结构和数据在磁盘中的存储方式。在阅读本文之前希望您对Druid和数据存储有简单了解。

分类
uncategorized

KYLIN、DRUID、CLICKHOUSE核心技术对比

KYLIN、DRUID、CLICKHOUSE是目前主流的OLAP引擎,本文尝试从数据模型和索引结构两个角度,分析这几个引擎的核心技术,并做简单对比。在阅读本文之前希望能对KYLIN、DRUID、CLICKHOUSE有所理解。

分类
uncategorized

Kylin数据模型

Apache Kylin是一款国人主导的优秀的OLAP引擎,工作中对Kylin有大规模的使用,尝试总结Kylin核心技术,本文是第一篇,偏向数据模型方面。

分类
uncategorized

KYLIN查询响应慢问题分析

本文记录生产环境一次Kylin偶尔查询缓慢问题以及问题分析。 问题描述 业务反馈查询缓慢,通过日志查看确实有查 […]

分类
uncategorized

一次Druid crash问题分析

记录一次生产环境Druid崩溃问题分析。

分类
uncategorized

How Java object layout in memory?

As we all know in database query is about computation. Computation requires data deserialized as objects in memory. So how object layout in memory and how many memory it cost is very important especially for waste memory operators like group-by, join, count-distinct etc.