当前位置: 首页 > 内训课程 > 课程内容
广告1
相关热门公开课程更多 》
相关热门内训课程更多 》
相关最新下载资料

进入大数据的真实世界-数据挖掘入门和应用

课程编号:51472

课程价格:/天

课程时长:2 天

课程人气:328

行业类别:行业通用     

专业类别:大数据 

授课讲师:林海

  • 课程说明
  • 讲师介绍
  • 选择同类课
【培训对象】


【培训收益】


第一单元 思维转变:从报表统计思维进入数据分析思维
一、入门:数据是对“事实”的观测
二、转变:数据思维意味着什么
1、主动找数据变为被动推荐
2、抽样数据变为全集数据
3、要求精确变为欢迎复杂
4、事后分析变为实时监控
5、专家分析变为机器学习
6、由流程为核心变为以数据为核心
7、由客户分类变为个性化服务
8、由人与人连接变为人与机器连接

第二单元 认知重构:进入模型和算法统治的世界
一、数据分析三大核心模型
1、分类:真与假;好与坏;高、中、低。不会分类,就不会思考
2、预测:输入变量,求得结果。代表了掌握规律的能力,生活是可预知的
3、相关性:模糊、近似、有关,是一种简便的、粗略的全盘操控能力
二、五大初级算法
1、相关性分析:最入门、最常用、最刚需的分析方法
2、散点图分析:最被忽略的探索性分析方法
3、概览性分析:教科书上都不重视的全局总览的分析方法
4、回归分析:最容易理解的由x推导出y的方程式分析法
5、聚类分析:最粗暴的物以类聚人以群分的分析方法
三、六大中级算法
1、降维分析:数据太多,抓住主要数据的方法
2、决策树分析:最容易理解的决策分析
3、关联规则分析:貌似没有规模,却可以寻找一个规律
4、相似性分析:当前最热门的分析方法,如:人脸识别、指纹识别
5、可视化分析:河流图、风向图、热力图等各种别具一格的数据呈现方式
6、文本分析:从大量的文字中快速提取关键信息
四、两大大数据高级算法
1、神经网络算法:最牛逼的模拟大脑的算法,如埃尔法狗围棋
2、支持向量机算法:实用性和准确性较强的一个机器学习算法

第三单元 操作实战:从代码中观测到的“真实”世界
一、学会用数据分析创新性的解决问题
1、What:问题是什么
2、Judgement:能用数据分析解决吗
3、Prerequisite:具备数据基础吗
4、ModelSelect:选择哪个模型
5、Visualization:怎么呈现结果
6、Design:设计流程,形成文档
二、学会用代码去测试和逼近真相
1、数据获取(导入数据、爬取数据)
2、数据探索分析、概览分析
3、明确分析目的
4、选择x和y
5、对格式进行转换
6、选择模型(模型选择准则)
7、使用交叉验证规则,切分数据
8、用模型进行训练
9、分析模型预测结果
10、确定最优模型
11、使用和预测
12、报告和呈现 

咨询电话:
0571-86155444
咨询热线:
  • 微信:13857108608
联系我们