大数据分析师
据《2016-2021年》显示,目前我国大数据产业规模可达1500亿元,未来5年将进入“加速期”,到2020年将达到8000亿元的规模,实现几何级增长。
从产业细分看,大数据产业分为基础层、软件层和应用层三大块,但现在我国大数据应用层仅占10%的比例,明显是个“短板”。现在,我国众多家电、商业、旅游企业都高度重视大数据的搜集和开发应用,对于传统企业来说,大数据是传统产业向“互联网+”改造的必经之路,可是传统企业如何将业务、产品、管理等进行数据化改造,成为企业关注的焦点。。
◇ 课程概况
总学时:3个月(75天)
课程安排:880课时
授课方式:小班面授
班级设置:(欢迎大数据数据分析爱好者前来报名学习)
教学模式:直播授课+在线视频辅助+导师项目实训
☆★教学内容
1、JAVA语言
JAVA语法,JAVA,JAVA操作数据库和Hadoop;
2、SQL语言
SQL简介,数据定义语言(DDL:DATA DEFINITION LANGUAGE),MYSQL数据类型,数据操作语言(DML: DATA MANIPULATION LANGUAGE),多源数据表的聚合(JOIN),数据表的合并、交集,SQL实用函数,实验:SQL编程(实验手册);
3、Linux
Linux概念,Linux的基本操作,实验8—Linux上机操作(实验手册),Sh ell编程,实验:Shell编程(实验手册);
4、Python
Python语言简介,DataFrame,Python连接数据库与Hadoop系统,实验:Python编程与数据分析(实验手册);
5、数据库
数据库的概念,MySQL基础,实验:MySQL的安装(实验手册),MySQL的配置,实验:MySQL的配置(实验手册),创建数据库,创建数据表,实验:数据库建表,MySQL用户管理,实验:数据库建表,数据上传(实验手册);
6、数据建模
数据建模概念,关系型数据库数据建模的特点,元数据与数据字典,实验:学校管理数据库数据建模(实验手册);
7、指标体系
基本计量(介绍总量指标、相对指标、平均数、中值、范围、百分数等等),指标体系的概念(电商为例),指标体系的应用技术,利用指标表达经营状况(电商为例),实验:指标设计(实验手册);
8、Tableau
Tableau简介,数据连接,数据编辑与融合,可视化分析操作,绘制地图,设计仪表板与故事,实验:完整实战案例(实验手册)
9、Excel数据分析
Excel用于数据分析的案例,Excel的function,Excel的图表,实验:Excel数据分析(实验手册);
10、Hadoop
Hadoop原理,HDFS与MapReduce,实验:MapReduce编程(实验手册),Hive,实验:Hive编程(实验手册),Spark,实验:Spark编程(实验手册);
11、数据仓库
数据仓库概念,ETL基础,数据仓库的设计,数据仓库的实现与软件,实验:从数据库到数据仓库(实验手册),数据清洗与软件,实验:数据清洗(实验手册);
12、常见统计分析技术
统计概率分布,数据分布的描述(介绍统计表与统计图。不同概率分布的计量描述方法),数据样本偏差分析,假设检验,回归(线性与逻辑回归),实验:统计分析方法的实际应用(实验手册);
13、数据分析报告的撰写
数据分析报告的原则,数据分析报告的作用,数据分析报告的种类,数据分析报告的结构,数据分析报告案例鉴赏,实验:分析报告写作实战案例(实验手册);
14、爬虫
基本的正则表达式、Python单线程爬虫、XPath与多线程爬虫、Scrapy,掌握如何编写定向爬虫,能使用Python的Requests模块和正则表达式编写简单的爬虫,能使用Scrapy开源爬虫框架与数据库配合提高爬取效率,了解动态加载网页内容的爬取和应对一些反扒虫机制的方法,实验:爬虫实战;
15、其他分析软件介绍
SAS介绍,SPSS介绍,了解SAS的基本界面和编程,了解SPSS的基本界面和编程;
16、机器学习
决策树,聚类分析,关联分析,实验:商业决策规则的生成实战案例(实验手册),实验:同类型客户群体的发现实战案例(实验手册),实验:客户细分(使用上述客户PROFILING数据表,关联+分类)实战案例(实验手册)
17、常见数据量化分析技术
数据分析方法,如对比分析法、分组分析法、结构分析法、平均分析法、交叉分析法、综合评价分析法、漏斗图分析法、矩阵关联分析法等,5W2H分析原理,数据分析的三个方向与数据分析法的选择,实验:数据分析方法的实际应用(实验手册);
18、大数据项目强化
大数据职业介绍,大数据的基础知识,可视化设计逻辑与实现,数据质量控制理论,面向分析的数据编程范例,数据项目设计与执行,实验:电商相关者体数据分析的实战案例(实验手册);