CDH大数据平台

公众号:yunops

一、概述

Hadoop 比较流行的主要有 2 个版本,Apache 和 Cloudera(CDH)版本,CDH 基于 Apache Hadoop 二次开发,优化了组件兼容和交互接口、简化安装配置、提供界面统一管理程序,更适合生产环境使用。而且哪怕你用不到大苏韩剧的其他相关组件,用 CDH 来管理 zookeeper 和 kafka 也是相当不错的,当然,管理 kafka 集群有更好的选择:Cruise Control,这个另说了,我们这里应用一下 cdh。

注:CDH5 和 CDH6 可能有所出入,以下内容均基于 CDH6.2。

二、安装部署

关于 CDH 的安装部署网上很多资料,这里就不逐步细说了,这里只参考其中一篇做出部分补充说明。