|
北京、上海、广州、成都长期开班
【Cloudera Apache Hadoop程序员课程】
课时:4天
学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,
讨论为更大型的工作流程而设计技术。
这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。
程序员课程也引入了Apache生态项目比如Hive、Pig、HBase、Flume和Oozie。
在完成课程后,学员被鼓励参加Cloudera认证Apache Hadoop程序员(CCDH)考试。
【课程内容】
1、MapReduce与HDFS内核知识以及如何编写MapReduce程序
2、Hadoop开发的最佳实践,调试、实现工作流及通用算法
3、如何利用Hive、Pig、Sqoop、Flume、Oozie及其他Hadoop的组件
4、按需定制WritableComparables与InputFormats处理复杂的数据类型
5、利用MapReduce编写、执行连接操作以整合不同数据集合
6、用于现实世界数据分析所需的高级HadoopAPI主题
7、用Java写MapReduce程序,用Streaming写MapReduce程序
8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码
9、Partitioners和Reducers如何一起工作,定制化Partitioners
10、定制Writable和WritableComparable
11、用SequenceFile和Avro数据文件存储二进制数据
【学员基础】
该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先
【授课形式】
案例教学+上机实践
【Cloudera 数据分析课程】
课时:4天
针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
学习Apache Pig、Apache Hive和Cloudera Impala如何通过过滤联接和其他用户自定义的功能
来支持数据的转型和分析。
【课程内容】
1、Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
2、pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
3、pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
4、pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
5、用流处理和UDFs扩展pig,Macros和Imports、contributed functions,用其他语言和pig一起处理数据
6、pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
7、hive表结构和数据储存、对比hive和传统数据库、hive vs.pig、hive使用案例
8、hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
9、impala和hive、pig、关系数据库的不同、使用impala shell
10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
11、对比map reduce、pig、hive、impala和关系数据库
【学员基础】
该课程适合有SQL经验和基本UNIX和Linux命令的数据分析师、业务分析师和管理员
事先无需Java和Apache Hadoop的经验
【授课形式】
案例教学+上机实践
【咨询方式】
电话:021-60491209、15000519329(陈老师),010-82526882(高老师)
邮箱:zhouwh@diitech.cn,chenl@diitech.cn
交流群:478790619、475436950
|
|