hadoop实战手册pdf电子书籍下载百度网盘-ag旗舰厅在线

hadoop实战手册pdf电子书籍下载百度网盘
hadoop实战手册pdf电子书籍下载百度网盘
hadoop实战手册pdf电子书籍下载百度网盘

 

hadoop实战手册中文版pdf电子版书籍百度网盘下载

这是一本hadoop实用手册,主要针对实际问题给出相应的ag旗舰厅在线的解决方案。《hadoop实战手册》特色是以实践结合理论分析,手把手教读者如何操作,并且对每个操作都做详细的解释,对一些重要的知识点也做了必要的拓展。全书共包括3个部分,第一部分为基础篇,主要介绍hadoop数据导入导出、hdfs的概述、pig与hive的使用、etl和简单的数据处理,还介绍了mapreduce的调试方式;第二部分为数据分析高级篇,主要介绍高级聚合、大数据分析等技巧;第三部分为系统管理篇,主要介绍hadoop的部署的各种模式、添加新、退役、快速恢复、mapreduce调优等。

《hadoop实战手册》适合各个层次的hadoop技术人员阅读。通过阅读《hadoop实战手册》,hadoop初学者可以使用hadoop来进行数据处理,hadoop工程师或者数据挖掘工程师可以解决复杂的业务分析,hadoop系统管理员可以更好地进行日常运维。《hadoop实战手册》也可作为一本hadoop技术手册,针对要解决的相关问题,在工作中随时查阅。


书籍作者简介:
jonathan r. owens:软件工程师,拥有java和c 技术背景,最近主要从事hadoop及相关分布式处理技术工作。目前就职于comscore公司,为核心数据处理团队成员。comscore是一家知名的从事数字测量与分析的公司,公司使用hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 jon lentz:comscore核心数据处理团队软件工程师。他更倾向于使用pig脚本来解决问题。在加入comscore之前,他主要开发优化供应链和分配固定收益证券的软件。 brian femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于potomac fusion公司,这家公... jonathan r. owens:软件工程师,拥有java和c 技术背景,最近主要从事hadoop及相关分布式处理技术工作。目前就职于comscore公司,为核心数据处理团队成员。comscore是一家知名的从事数字测量与分析的公司,公司使用hadoop及其他定制的分布式系统对数据进行聚合、分析和管理,每天处理超过400亿单的交易。 jon lentz:comscore核心数据处理团队软件工程师。他更倾向于使用pig脚本来解决问题。在加入comscore之前,他主要开发优化供应链和分配固定收益证券的软件。 brian femiano:本科毕业于计算机科学专业,并且从事相关专业软件开发工作6年,最近两年主要利用hadoop构建高级分析与大数据存储。他拥有商业领域的相关经验,以及丰富的政府合作经验。他目前就职于potomac fusion公司,这家公司主要从事可扩展算法的开发,并致力于学习并改进政府领域中最先进和最复杂的数据集。他通过教授课程和会议培训在公司内部普及hadoop和云计算相关的技术。 傅杰,硕士,毕业于清华大学高性能所,现就职于优酷土豆集团,任数据平台架构师,负责集团大数据基础平台建设,支撑其他团队的存储与计算需求,包含hadoop基础平台、日志采集系统、实时计算平台、消息系统、天机镜系统等。个人专注于大数据基础平台架构及安全研究,积累了丰富的平台运营经验,擅长hadoop平台性能调优、jvm调优及诊断各种mapreduce作业,还担任china hadoop submit 2013大会专家委员、优酷土豆大数据系列课程策划&讲师、easyhadoop社区讲师。 赵磊,硕士,毕业于美区科学技术大学,现就职于优酷土豆集团,任数据挖掘算法工程师,负责集团个性化推荐和无线消息推送系统的搭建和相关算法的研究。个人专注于基于大数据的推荐算法的研究与应用,积累了丰富的大数据分析与数据挖掘的实践经验,对分布式计算和海量数据处理有深刻的认识。 卢学裕,硕士,毕业于武汉大学,曾供职腾讯公司即通部门,现就职于优酷土豆集团,担任大数据技术负责人,负责优酷土豆集团大数据系统平台、大数据分析、数据挖掘和推荐系统。有丰富的hadoop平台使用及优化经验,尤其擅长mapreduce的性能优化。基于hadoop生态系统构建了优酷土豆的推荐系统,bi分析平台。

pdf书籍目录:
第1章 hadoop分布式文件系统——导入和导出数据 1
第2章 hdfs 28
第3章 抽取和转换数据 51
第4章 使用hive、pig和mapreduce处理常见的任务 85
第5章 高级连接操作 104
第6章 大数据分析 123
第7章 高级大数据分析 147
第8章 调试 174
第9章 系统管理 189
第10章 使用apache accumulo进行持久化 204

上一篇 2022年7月5日 下午1:54
下一篇 2022年7月5日 下午1:54

猜你喜欢

网站地图