课程编号:37664
课程价格:¥25000/天
课程时长:3 天
课程人气:881
行业类别:IT网络
专业类别:大数据
授课讲师:叶梓
【课程大纲】(培训内容可根据客户需求调整) 时间 内容 案例实践与练习 Day1 上午 实验环境搭建 数据预处理 实验环境搭建 1、 anaconda 包的安装 2、pip install 的技巧 3、最简版的 python 教程 4、通过 anaconda 配置多个环境 5、Jupyter Notebook 的使用 数据预处理 1、 归一化 2、模糊集与粗糙集 3、无标签降维:PCA 4、分解降维:SVD 5、 数据压缩:DFT、小波变换 案例实践: 1、Anaconda(python)安装 2、 Tensorflow 安装 3、 绘图工具包 matplotlib 4、 opencv 包的使用 Day1 下午 回归与时序分析 决策树 聚类 关联规则 回归与时序分析 1、 线性回归 2、非线性回归 3、logistics 回归 4、平稳性、截尾与拖尾 5、ARIMA 决策树 1、 分类和预测 2、熵减过程与贪心法 3、ID3 与 C4.5 4、 其他改进方法 5、 前置剪枝与后置剪枝 聚类 1、 监督学习与无监督学习 2、K-means 3、k-medoids 4、基于层次、密度、网格的方法 5、手肘法确定合理的聚类个数 关联规则 1、 频繁项集 2、支持度、置信度与提升度 3、Apriori 性质 4、连接与剪枝 案例实践: 1、回归的实验 2、 ARIMA 预测实验 3、 各种聚类的区别 4、 鸢尾花数据的决策树分类 Day2 上午 性能评价指标 从朴素贝叶斯到 EM 性能评价指标 1、 混淆矩阵与精确率; 2、P、R 与 F1 3、ROC 与 AUC 4、对数损失 5、泛化性能评价:k 折验证验证 从朴素贝叶斯到 EM 1、 条件概率、联合概率 2、“概率派”与“贝叶斯派” 3、朴素贝叶斯模型 4、极大似然估计 5、对数似然函数 6、EM 算法 案例实践: 1、超市购物篮——关联规则分析 2、 印第安人患糖尿病的风险 3、 绘制 ROC 并计算 AUC、F1 4、 双正态分布的参数估计 5、 Kaggle:泰坦尼克号幸存者分析 Day2 下午 BP 神经网络 支持向量机 遗传算法 BP 神经网络 1、 人工神经元及感知机模型 2、前向神经网络 3、Sigmoid 与 tanh 4、梯度下降 5、误差反向传播 支持向量机 1、 “双螺旋”问题 2、基本模型与惩罚项 3、求解对偶问题 4、核函数:映射到高维 5、从二分类到多分类 6、用于连续值预测的支持向量机 遗传算法 1、 种群、适应性度量 2、 交叉、选择、变异 3、 基本算法 案例实践: 1、可以手算的神经网络 2、 手推一个 BPNN 3、 各种随机梯度下降 案例实践: 1、人脸识别:SVM 2、 “同宿舍”问题:遗传算法 Day3 上午 隐马尔科夫模型 条件随机场 隐马尔科夫模型 1、 马尔科夫过程 2、隐马尔科夫模型 3、三个基本问题(评估、解码、学习) 4、前向-后向算法 5、Viterbi 算法 6、Baum-Welch 算法 条件随机场 案例实践: 1、掷骰子的序列(HMM 前向算法) 2、 我是不是病了?(viterbi 算法) 3、 实现图像轮廓精细分割(CRF) 1、 最大熵原理 2、无向图模型 3、MRF 与 CRF 4、定义在最大团上的势函数 5、线性链条件随机场 Day3 下午 集成学习 强化学习 深度学习初步 集成学习 1、 bagging 系列 2、随机森林 3、boosting 系列 4、Adaboost 5、GBDT 与 Xgboost 6、catboost 与 lightGBM 7、 stacking 系列 强化学习 1、 agent 的属性 2、马尔科夫奖励/决策过程 3、状态行为值函数 4、exploration and exploitation 5、Bellman 期望方程 6、最优策略 7、 策略迭代与价值迭代 8、蒙特卡洛法 9、时序差分法 深度学习初步 1、 连接主义的兴衰史 2、深度学习与 NN 的区别与联系 3、目标函数与激励函数改进 4、梯度下降的改进 5、用于分类的 CNN 6、目标检测 7、 RNN 与 LSTM 8、生成对抗网络(GAN)
叶梓,上海交通大学计算机专业博士毕业,高级工程师。主研方向:数据挖掘、机器学习、人工智能。历任国内知名上市IT企业的AI技术总监、资深技术专家,市级行业大数据平台技术负责人。
长期负责城市信息化智能平台的建设工作,开展行业数据的智能化应用研发工作,牵头多个省级、市级行业智能化信息系统的建设,主持设计并搭建多个省级、市级行业大数据平台。参与国家级人工智能课题,牵头上海市级人工智能示范应用课题研究。
带领团队在相关行业领域研发多款人工智能创新产品,成功落地多项大数据、人工智能前沿项目,其中信息化智能平台项目曾荣获:“上海市信息技术优秀应用成果奖”。带领团队在参加国际NLP算法大赛,获得Top1%的成绩。参与国家级、省级大数据技术标准的制定,曾获省部级以上的科技创新一等奖。
1. 论文发表/项目经历
在国内外期刊、会议中发表论文27篇,其中被SCI/EI收录4篇
项目经历:
l 上海市城市信息化人工智能项目 项目负责人
ü 研发智能服务系统,包括:元宇宙与虚拟数字人、基于人工智能的内容生成(AIGC)、基于NLP技术的对话系统、基于深度学习的图像识别系统、基于智能推理的行业推荐系统。
相关工作:
作为项目总负责,负责项目管理、产品研发、系统分析、技术指导、算法指导等。
l 上海市城市智能信息化工程 总工程师
ü 采用大数据技术,建设市级信息平台,完成试点单位接入并采集居民相关信息,实现市级平台档案等服务,并实现所有单位的全面接入。
ü 为解决超量数据的存储与计算的问题,搭建了存储全市数据的云计算平台,并在其上进行了基于大数据的分析和挖掘工作。
作为总工程师,负责技术管理、系统分析、云平台数据存储设计、数据分析与挖掘指导、开发指导。
l 上海市城市信息化领域智能联网工程 技术经理
ü 建设内容包括:接入单位的联网;智能卡的实现;城市信息化智能平台的升级;科研平台的扩展与升级;建立决策支持系统;评估体系的展示设计;短信平台的实现;违规操作的提醒;协同智能服务平台的实现等。
作为技术经理负责总体架构设计、接口设计、大数据平台设计、AI技术指导等。
3. 主攻方向
具有扎实的数据挖掘、机器学习、深度学习等人工智能理论基础;了解AIGC等技术前沿动态。
精通机器学习、深度学习的理论、模型、算法、调优等;精通算法设计;
熟悉深度学习在自然语言处理、计算机视觉两大核心领域的实用技巧;
15年以上的程序开发经验,熟悉常用程序开发架构,独立完成多个产品级软件的设计与开发。
人工智能机器学习算法在项目中的实战
一.介绍机器学习,什么是机器学习a) 简单介绍机器学习,数据挖掘b) 机器学习和数据挖掘的基本概念和原理c) 机器学习用来解决什么问题机器学习的应用场景1) 机器学习应用场景之一------分类以及分类的应用场景a) 分类概念b) 分类的应用c) 分类和聚类、推荐的区别d) 分类工作原理e) 分类中概念术语..
¥ 元/ 天
人气:1164
机器学习闭环系统设计方法
第一章. 机器学习和深度学习系统设计方法论a)机器学习和深度学习的概念和区别b)人工智能算法工程师的日常工作流程c)传统机器学习的系统设计方法d)人工智能时代深度学习的系统设计方法第二章.机器学习和深度学习人工智能的常见开发流程a)洞悉公司业务业务逻辑痛点,抽象出计算机解决方法方案b)数据清洗和预处理c)构建数据集,数..
人气:1112
人工智能机器学习与深度学习实战案例及应用
章节 内 容 第一节 ..
人气:1051