查看: 1942|回复: 0

[培训] 北京上海广州Cloudera Hadoop大数据:CCAH(管理员)、CCSHB(Hbase)

[复制链接]
发表于 2016-2-24 11:41:10 | 显示全部楼层 |阅读模式
3月北京开班时间:开发者(328-31
3月上海开班时间:管理员(31-4日);开发者(323-26日)
3月广州开班时间:Hbase312-15
【其他课程安排请咨询】15000519329(陈老师)
Cloudera大数据 478790619
课程内容:
Cloudera Apache Hadoop管理员课程】
    课时:4
    学习系统管理的概念和Apache Hadoop的最佳实践,
    从安装和配置到负载均衡和调优。
    这个4天的的课程通过动手时间来赋予你部署的经验,
    以及更多的安全方面的经验和故障排除。
    课程结束后,学员被鼓励去参加ClouderaApache Hadoop管理员(CCAH)考试。
    【课程内容】
    1Hadoop分布式文件系统(HDFS
    2YARN/MapReduce的工作原理
    3、如何优化Hadoop机群所需要的硬件配置
    4、搭建Hadoop机群所需要考虑的网络因素
    5Hadoop机群维护和控制
    6、如何利用Hadoop配置选项进行系统性能调优
    7、如何利用FairScheduler为多用户提供服务级别保障
    8Hadoop机群维护和监控
    9、如何使用Flume从动态生成的文件加载到Hadoop
    10、如何使用Sqoop从关系型数据加载数据
    11Hadoop生态系统工具(如HiveImpalaPigBase
    【学员基础】
    具备基本Linux系统管理经验。不需要事先掌握Hadoop相关知识。
    【授课形式】
案例教学+上机实践
Cloudera Apache HBase课程】(通过考试可颁发CCSHB全球认证证书)
    课时:4
    学习如何将HBase作为一个分布式的数据储存以实现低延迟的查询和高扩展的吞吐。
    4天的课程涵盖了HBase架构、数据模型、Java API及其他高级课题和最佳实践。
    完成该课程后,学员被鼓励参加cloudera认证Apache HBase专家(CCSHB)考试来验证和认证其Hadoop经验。
   
    【课程内容】
    1、什么是HBase、为什么要用HBaseHBaseRDBMSHBase的给予和索取
    2HBase系统管理APIHBase Shell、创建表、HBase Java API、系统管理调用
    3、通过HBase API访问数据,API的使用、数据检索、在shell添加和更新数据、删除数据
    4、用API添加、更新数据,Scan API、高级API技术、使用Eclipse
    5、集群组件、HBase如何扩展,HBase写路径、读路径,压缩和拆分
    6HBase的安装、配置及其安全性
    7HBase daemnonZooKeeperHBase系统管理
    8、复制、备份、MapeRduceHBase集群
    9HBaseRowKey设计,从关系数据库到HBase表结构设计,以应用为中心的设计
    10、列族、表结构设计的考虑点、热点处理
    11HBase生态系统:OpenTSDBKijiHBasehive
    【学员基础】
    该课程适合需要使用HBase的开发员和管理员。
    预备的数据库和数据建模的经验有帮助,但不是必须的。
    预备的Java知识有帮助,Hadoop经验不是必须的,
    但是clouderaApache Hadoop开发培训课是个绝佳的基础。
    【授课形式】
    案例教学+上机实践
   Cloudera Apache Hadoop程序员课程】
    课时:4
    学习Hadoop分布式文件系统(HDFS)基础和MapReduce框架以及如何利用其API来编写程序,
    讨论为更大型的工作流程而设计技术。
    这门4天的课程涵盖了为MapReduce程序修复漏洞和优化性能所需的高级技巧。
    程序员课程也引入了Apache生态项目比如HivePigHBaseFlumeOozie
   
    【课程内容】
    1MapReduceHDFS内核知识以及如何编写MapReduce程序
    2Hadoop开发的最佳实践,调试、实现工作流及通用算法
    3、如何利用HivePigSqoopFlumeOozie及其他Hadoop的组件
    4、按需定制WritableComparablesInputFormats处理复杂的数据类型
    5、利用MapReduce编写、执行连接操作以整合不同数据集合
    6、用于现实世界数据分析所需的高级HadoopAPI主题
    7、用JavaMapReduce程序,用StreamingMapReduce程序
    8、调试MapReduce代码的策略,利用localjobrunner在本地测试MapReduce代码
    9PartitionersReducers如何一起工作,定制化Partitioners
    10、定制WritableWritableComparable
    11、用SequenceFileAvro数据文件存储二进制数据
    【学员基础】
    该课程适合具有一定编程经验的程序开发人员。由于课程中需要完成Hadoop相关编程练习,熟悉Java者优先
    【授课形式】
    案例教学+上机实践
    Cloudera 数据分析课程】
    课时:4
    针对任何需要在Hadoop上实时地通过SQL和熟悉的脚本来管理、操纵和查询大型复杂数据的人。
    学习Apache PigApache HiveCloudera Impala如何通过过滤联接和其他用户自定义的功能
    来支持数据的转型和分析。
   
    【课程内容】
    1Hadoop生态圈、实验场景介绍、用Hadoop工具导入数据
    2pig的特性、使用案例、和pig交互、pig Latin语法、Field定义、用pig执行ETL流程
    3pig处理复杂数据,复杂/nested嵌套的数据类型、用pig分析广告战役的数据
    4pig的多数据组操作,pig链接多数据组、用pig分析离散的数据组
    5、用流处理和UDFs扩展pigMacrosImportscontributed functions,用其他语言和pig一起处理数据
    6pig故障排查和优化,用web界面排查一个故障的任务、Data采样和故障排查、理解执行计划、提高pig任务性能
    7hive表结构和数据储存、对比hive和传统数据库、hive vs.pighive使用案例
    8hive的关系数据分析、数据管理、文本处理、优化及扩展,在shell、脚本和hue上运行hive查询
    9impalahivepig、关系数据库的不同、使用impala shell
    10、采样impala分析数据,过滤、排序and limiting results,提升impala性能,impala的交互式分析
    11、对比map reducepighiveimpala和关系数据库
    【学员基础】
    该课程适合有SQL经验和基本UNIXLinux命令的数据分析师、业务分析师和管理员
    事先无需JavaApache Hadoop的经验
    【授课形式】
    案例教学+上机实践
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关于我们  -  服务条款  -  使用指南  -  站点地图  -  友情链接  -  联系我们
电子工程网 © 版权所有   京ICP备16069177号 | 京公网安备11010502021702
快速回复 返回顶部 返回列表