课程内容:
1、深入学习数据的采集、清洗、预处理、存储、分析挖掘、机器学习及数据可视化;
2、深入理解大数据基础架构和平台、基于Hadoop的大数据体系,熟悉Hadoop相关开源项目;
3、熟练掌握Spark、Streaming、Kafka、Zookeeper、Hbase、Redis、Elasticsearch、SpringFreamwork等;
4、对HDFS、Yarn的原理有深入了解,掌握系统优化、资源分配;
5、深入学习面向对象的程序设计、XML、数据库设计以及软件工程;
6、熟练使用常用的数据库,如Mysql、SQL SERVER等,熟练使用SQL语句。