当前位置: 首页 > 内训课程 > 课程内容
广告1
相关热门公开课程更多 》
相关热门内训课程更多 》
相关最新下载资料

大数据与Spark实战

课程编号:40780

课程价格:¥21000/天

课程时长:2 天

课程人气:306

行业类别:行业通用     

专业类别:大数据 

授课讲师:张晓诚

  • 课程说明
  • 讲师介绍
  • 选择同类课
【培训对象】


【培训收益】


大数据与Spark实战
一级 二级 细节1 细节2
任务1 (前导) 学习方法    
需求分析    
所用工具安装与配置    
敏捷开发    
DevOPS    
任务2 (Hadoop) (概述) 概述 起源与历史  
图解生态系统  
文件系统 架构
文件系统访问
JavaAPI接口
I/O系统 文件数据结构
文件序列化
MR工作原理 MR框架结构
Shuffle和Sort
基于Linux的搭建方式(概述)    
一线应用方式 Java+MR  
sqoop+Hive  
sqoop+Hive+HBase  
任务3 (Spark) 起源与历史    
架构组成    
安装与配置    
与Hadoop的本质差别    
基于Scala的SparkShell的使用    
任务4 (SparkSQL) 历史发展    
性能    
运行架构 catalyst  
sqlContext  
hiveContext  
组件解析    
运行过程 hive/console  
基础应用 sqlContext的RDD  
Json  
hiveContext使用  
高级应用 TriftServer和CLI  
JDBC访问sparkSQL数据  
综合应用 店铺分类 使用sparkSQL和MLLib  
PageRank计算最有价值的网页 使用sparkSQL和GraphX  
Hive On Spark    
任务5 (SparkStreaming) SparkSQL与SparkStreaming结合 完成实时的日志数据统计    
Flume+Kafka+SparkStreaming+SparkSQL    
任务6 (总结) 现实中基于SparkSQL与SparkStreaming 一线应用总结    
实时计算展望     

咨询电话:
0571-86155444
咨询热线:
  • 微信:13857108608
联系我们