返回
如荷学
置顶
该校与厚学网暂未合作,平台不保证课程的真实有效性,如有侵权等争议,请及时与厚学网联系处理
厚学网
大数据分析进修班
咨询 在线咨询
课程级别
入门级
培训周期
一周以内
培训时间
全日制
课程价格
询价
上课地址
北京市海淀区厂洼街3号丹龙大厦B3018
课程详情

 

 一、学习目标:

  1.零基础脱产学习,1个月精学大数据技术

  2.计算机、统计、数学等专业学习更佳

  3.包学会,成为大数据稀缺人才,高薪就业

  4.CDA大数据就业帮,助你前程似锦

  5.大数据未来已来,只等你改变自己

  二、课程内容:

  14章分布式集群架构

  14-01大数据行业前沿应用与知识介绍

  14-02Linux入门基础

  14-03Hadoop入门介绍

  14-04Hadoop单机环境搭建

  14-05Hadoop伪分布式集群搭建

  14-06Hadoop完全分布式集群搭建

  15章分布式文件存储系统HDFS

  15-01HDFS简介

  15-02HDFS编程入门

  15-03HDFS读写文件

  15-04HDFS架构原理及常用指令

  16章ETL工具Sqoop基本原理和常用指令

  16-01Sqoop介绍

  16-02Sqoop原理

  16-03Sqoop部署

  16-04关系型数据库导入Hadoop

  16-05Hadoop导入关系型数据库

  16-06Sqoop job应用

  17章大数据仓库知识应用

  17-01Hive架构原理和技术方向

  17-02HiveQL数据查询、函数(聚合函数、窗口函数、UDF)

  17-03Hbase表设计及数据查询

  17-04商业应用案例—宽表设计与用户画像

  17-05商业应用案例—网站流量分析与页面运营

  18章Spark架构原理和核心组件

  18-01Spark介绍

  18-02Spark数据结构及编程语言接口

  18-03Spark与分布式数据库和分布式数据仓库的集成方法

  19章PySpark编程指南与Spark RDD相关操作

  19-01PySpark开发环境搭建

  19-02PySpark编程入门:Spark基本数据结构

  19-03 PySpark编程入门:PySpark常用语句

  19-04采用PySpark读取分布式数据库中数据

  19-05PySpark数据清洗案例

  20章Spark MLLib与机器学习算法实践


校区安排(1) 更多
校区
如荷学
地址
北京市海淀区厂洼街3号丹龙大厦B3018
预约报名
立即获取报价

请选择想要达成的目标

基本掌握
熟练掌握
完全掌握
取消

请选择想要学习的时间

一个月内
三个月内
半年或一年
取消
刷新
图形验证
关闭
>>
拖动左边滑块完成上方拼图