Cloudera 简介
> Cloudera 是什么?
Cloudera是新一代大数据软件和服务提供商,为企业提供强大的数据管理与数据分析能力。Cloudera成立于2008年,总部位于美国加利福尼亚州帕罗奥图。
Cloudera最初基于Apache Hadoop开源项目,开发了企业级Hadoop发行版CDH(Cloudera Distribution Including Apache Hadoop)。CDH使Hadoop更易于在生产环境中进行安装、配置和管理,推动了Hadoop在企业大数据方面的应用。
同时,Cloudera还开发了Cloudera Manager集群管理工具,通过可视化界面实现对Hadoop集群的部署、监控、扩容等管理功能。这大大降低了运维Hadoop的难度。
在成功的CDH和Cloudera Manager产品基础上,Cloudera进一步拓展产品线。其中,Impala作为大数据领域的高性能SQL查询引擎;Kudu提供快速分析型存储;Cloudera Data Science Workbench整合了各种数据分析工具。
最近,Cloudera推出了新一代的CDP(Cloudera Data Platform)产品,进一步融合云原生技术如Kubernetes与大数据处理,支持多种部署模式,是新一代云原生大数据分析平台。
凭借对大数据技术强大的创新与开发能力,Cloudera已经成长为大数据软件领域的领导者,为各行各业客户提供高效的数据驱动决策支持。
> cloudera能提供什么?
Cloudera可以为企业大数据应用提供全面的支持,主要包括:
1. 软件和工具
Cloudera提供CDH和CDP两大Hadoop发行版,以及Cloudera Manager等管理工具,可以便捷地搭建和管理大数据平台。
2. 自动化部署
使用Cloudera Manager和Cloudera Director,可以通过可视化的方式自动部署Hadoop、Spark等集群。不需要手动配置,大大简化部署。
3. 技术支持
Cloudera提供专业的技术支持团队,可以帮助客户解决使用Cloudera产品时遇到的问题,保证大数据平台高效稳定运行。
4. 培训服务
Cloudera提供在线和现场培训,帮助 IT团队掌握大数据技能,提高运维管理水平。
5. 咨询服务
Cloudera咨询服务可以根据客户需求定义大数据策略、架构设计、路线规划等,推动大数据项目落地。
6. 云端托管
Cloudera公有云可以直接在云端托管和使用Cloudera大数据服务,降低客户运维工作量。
综合利用Cloudera的软件、服务和支持,可以帮助企业顺利实施大数据平台,发挥大数据分析价值。
> 关于CDP和CDH架构
1. CDH
- 发布时间:2009年
- 诞生过程:Cloudera公司成立后,基于Apache Hadoop开源项目,对其进行企业级改进,形成了CDH产品。CDH使Hadoop更易于在生产环境大规模部署。
2. CDP
- 发布时间:2018年
- 诞生过程:在CDH的基础上,Cloudera结合开源社区的Spark、Impala等新技术,并吸收Docker、Kubernetes等理念,开发出了新一代的CDP产品。CDP定位为混合多云的数据管理和分析平台。
总结来说:
CDH诞生较早,其目标是在Hadoop基础上,构建企业级的Hadoop发行版。
CDP则吸收了云原生等新技术与理念,定位更加前瞻性,面向多云环境的数据管理与分析。
从时间顺序上,CDH是更早的产品,CDP则构建在CDH成功经验之上,融入了更多新的技术与设计理念。
CDP和CDH两个架构的主要特征: