linxx's blog

nodes in druid

集群管理层图

管理层
数据流

名词解释

  • dimension
  • matrics
  • historical node

    处理“历史”(非实时)数据的存储和查询。

    从deep storage里下载segments
    响应broker nodes发来的关于segments的需求,并把结果返回给broker nodes。
    向外表明自己和自身在zookeeper里面服务的segments,同时根据zookepers去监控来下载或者移除segments。

  • coordinator node

  • deepstorage
  • indexing

    把json格式的数据列表化,建立位图索引,压缩数据。

  • segment

    是上述过程得到的结果,包含dimension和matrics。它是druid里面的基本数据存储结构,存储在deepstorage里。
    接着在提供查询功能之前,historical nodes会先把data下载到本地磁盘,再做内存映射。