• Hadoop家族系列文章

Hadoop家族系列文章

HadoopFamilyWordle

Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。

从2011年开始,中国进入大数据风起云涌的时代,以Hadoop为代表的家族软件,占据了大数据处理的广阔地盘。开源界及厂商,所有数据软件,无一不向Hadoop靠拢。Hadoop也从小众的高富帅领域,变成了大数据开发的标准。在Hadoop原有技术基础之上,出现了Hadoop家族产品,通过“大数据”概念不断创新,推出科技进步。

作为IT界的开发人员,我们也要跟上节奏,抓住机遇,跟着Hadoop一起雄起!

学习路线图

Hadoop家族学习路线图 开篇必读

Hive学习路线图

Mahout学习路线图

编程实践

Hadoop历史版本安装

用Maven构建Hadoop项目

Hadoop编程调用HDFS

在Ubuntu中安装HBase

用Maven构建Mahout项目

Mahout推荐算法API详解

用MapReduce实现矩阵乘法

从源代码剖析Mahout推荐引擎

Mahout分步式程序开发 基于物品的协同过滤ItemCF

Mahout分步式程序开发 聚类Kmeans

PageRank算法并行实现

案例分析

海量Web日志分析 用Hadoop提取KPI统计指标        [视频购买]  [试看]

用Hadoop构建电影推荐系统        [视频购买]  [试看]

用Mahout构建职位推荐引擎        [视频购买]  [试看]

Mahout构建图书推荐系统        [视频购买]  [试看]

PeopleRank从社交网络中发现个体价值        [视频购买]  [试看]

基于Zookeeper的分步式队列系统集成案例        [视频购买]  [试看]

打赏作者