课程编号:32152
课程价格:¥26000/天
课程时长:2 天
课程人气:508
行业类别:行业通用
专业类别:大数据
授课讲师:傅一航
第一部分:预测建模基础 1、数据建模六步法 选择模型:基于业务选择恰当的数据模型 属性筛选:选择对目标变量有显著影响的属性来建模 训练模型:采用合适的算法,寻找到最合适的模型参数 评估模型:进行评估模型的质量,判断模型是否可用 优化模型:如果评估结果不理想,则需要对模型进行优化 应用模型:如果评估结果满足要求,则可应用模型于业务场景 2、数据挖掘常用的模型 数值预测模型:回归预测、时序预测等 分类预测模型:逻辑回归、决策树、神经网络、支持向量机等 市场细分:聚类、RFM、PCA等 产品推荐:关联分析、协同过滤等 产品优化:回归、随机效用等 产品定价:定价策略/最优定价等 3、属性筛选/特征选择/变量降维 基于变量本身特征 基于相关性判断 因子合并(PCA等) IV值筛选(评分卡使用) 基于信息增益判断(决策树使用) 4、训练模型及实现算法 模型原理 算法实现 5、评估模型 评估指标 评估方法 残差评估 6、模型优化 优化模型:选择新模型/修改模型 优化数据:新增显著自变量 优化公式:采用新的计算公式 7、模型应用 模型解读 模型保存/加载 模型应用/预测 8、好模型是优化出来的
第二部分:时序模型评估 1、评估指标 判定系数:和 平均误差:MAE 根均方差:RMSE 平均误差率:MAPE 2、信息准则指标 赤池信息准则(Akaike Information Criterion,AIC) 贝叶斯信息准则(Bayesian Information Criterion,BIC) HQIC(Hannan-Quinn Information Criterion,HQIC) 3、评估方法 滚动交叉验证法(cross validation) 4、其它评估 残差评估:白噪声评估
第三部分:趋势预测模型 问题:无法找到影响因素,无法回归建模,怎么办?随着业务受季节性因素影响,未来的销量如何预测? 1、时间序列简介 2、时序预测的原理及应用场景 3、常见时序预测模型 趋势类预测模型 季节类预测模型 平稳时序预测模型 其它高级模型 4、移动平均 应用场景及原理 理解滑动窗口 移动平均种类 一次移动平均 二次移动平均 加权移动平均 移动平均比率法 移动平均关键问题 最佳期数N的选择原则 最优权重系数的选取原则 演练:销售额预测模型及评估 演练:快销产品季节销量预测及评估 5、指数平滑 应用场景及原理 最优平滑系数的选取原则 指数平滑种类 一次指数平滑 二次指数平滑(Brown线性) 三次指数平滑 演练:煤炭产量预测 6、Holt趋势模型(亦称二次指数平滑) Holt线性模型 Holt指数模型 阻尼线性趋势 阻尼指数趋势 第四部分:季节预测模型 1、因素分解思想 2、时间序列的四个构成要素 长期趋势Trend 季节变动Seasonality 循环变动Circle 不规则变动Irregular 案例:时间序列的季节分解 3、Holt-Winters季节模型 三个组成部分 三个平滑因子 4、HW加法模型 适用场景 计算公式 超参优化 模型解读 5、HW乘法模型 6、HW指数模型 案例:航空飞行里程预测模型 案例:汽车销量预测模型 案例:沃尔玛收益预测模型 7、基于回归的季节模型 相加模型 相乘模型 模型训练及优化 模型解读 第五部分:平稳序列模型 1、平稳序列预测模型简介 2、序列平稳性概念 恒定的均值 恒定的标准差 与位置无关的协方差 3、序列平稳性检验 折线图法 ACF/PACF图 ADF检测法 4、特殊平稳序列:白噪声 案例:序列平稳性检验 案例:白噪声检验 5、平稳序列常用拟合模型 AR(p)自回归模型 MA(q)移动平均模型 ARMA(p,q)自回归移动平均模型 6、模型识别 ACF图 PACF图 7、模型定阶 图形定阶(ACF/PACF) 最小信息准则定阶 8、非平稳序列处理 平滑法 变量变换 差分运算:k步差分与d阶差分 9、ARIMA(p,d,q)建模流程 案例:上海证券交易所收盘价建模 10、SARIMA(p,d,q)(P,D,Q,S)模型 图形确定阶数 遍历确定阶数 11、时序模型总结
第六部分:模型质量评估篇 1、回归模型的评估指标 三个基本概念:SSR/SST/SSE 两个判定系数:R^2,调整R^2 三个误差指标:MAE/MAPE/RMSE 平均绝对误差MAE 均方差MSE/RMSE 平均误差率MAPE 2、模型的评估方法 原始评估法 留出法(Hold-Out) 交叉验证法(k-fold cross validation) 自助采样法(Bootstrapping) 3、时间序列的滚动交叉验证
第七部分:高级时序模型 1、Prophet模型介绍 趋势拟合 季节性预测 节假日和特殊事件的影响 离群值分析 案例:销售额时序预测模型 2、LSTM模型简介 数据集构造 形状构造 滚动预测
第八部分:广告点击量时序建模
结束:课程总结与问题答疑。