当前位置: 首页 > 公开课程 > 课程内容
广告1
相关热门公开课程更多 》
相关热门内训课程更多 》
相关最新下载资料

关于举办“大数据分析、可视化与AI交互式数据挖掘” 培训班的

课程编号:64149   课程人气:359

课程价格:¥5800  课程时长:3天

行业类别:不限行业    专业类别:职业素养 

授课讲师:专家库

课程安排:

       2026.6.28 广州 2026.8.29 西安 2026.10.24 重庆



  • 课程说明
  • 讲师介绍
  • 选择同类课
【培训对象】
大数据系统研发工程师、大数据分析师、数据安全研发人员、大数据应用开发工程师、数据可视化工程师、数据科学研究等相关人员。

【培训收益】
1.掌握大数据分析全流程实操 2.熟练数据可视化工具与技巧 3.理解AI数据挖掘核心算法 4.具备交互式数据探索能力 5.建立数据驱动决策思维 6.学会多源数据整合方法 7.拓宽行业数据应用视野 8.提升职场数据技能竞争力

第一天
上午 数据分析实战 第一讲 零基础学Python
1.Python背景
2.国内发展状况
3.基础语法
4.数据结构
5.绘图操作
6.特别针对向量计算模块
7.着重介绍Python在这方面的优势及用法
第二讲 数据分析方法论
1.讲解统计分析基础(统计学基本概念,假设检验,置信区间等基础)
2.结合数据案例说明其使用场景和运用方法
3.介绍数据分析流程和常见分析思路,同时结合案例进行讲解
第三讲 数据处理技法
1.从数据接入、数据统计、数据转换等几个方面进行讲解
2.数据接入包含接入MySQL、Oracle、Hadoop等常见数据库操作
3.数据统计包含Pandas包的具体用法和讲解
4.数据转换包含对数据集的关联、合并、重塑等操作
5.针对海量数据的情况下,介绍在Spark平台上的数据处理技术
6.结合真实环境进行操作讲解。
第一天
下午 数据挖掘理论及核心技术 第四讲 认识数据挖掘
1.数据挖掘基本概念
2.业务理解
3.数据理解
4.数据准备
5.建立模型
6.模型评估
7.模型部署各环节的工作内容及相关技术
8.结合业界经典场景,讲解数据挖掘的实施流程和方法体系
第五讲 Pandas进行数据预处理
1.数据合并
2.数据清洗(重复值、缺省值、异常值处理)
3.数据标准化(离差标准化、标准差标准化)
4.数据变换(哑变量转换、连续型数据离散化)
5.抽样、分区、样本平衡、特征选择
6.结合典型业务案例讲解其具体实现与应用场景,帮助学员掌握数据在建模前的清洗与特征构造思路
第二天
上午

大数据算法原理及案例实现(1) 第六讲 特征降维算法及Python实现
1.特征降维算法讲解
2.主要讲解主成分、LDA以及t-SNE原理
3.结合案例进行Python实现
4.针对海量数据情况下的应用场景,讲解实现思路和Python案例
第七讲 决策树算法及Python实现
1.决策树算法讲解
2.讲解ID3、C4.5、C5.0以及CART决策树算法的实现原理
3.结合案例进行Python实现
第八讲 好莱坞百万级影评数据分析与电影推荐实现(实战部分):
1.基于好莱坞百万级的影评数据,对数据进行建模、清洗、透视表操作。
2.然后根据用户画像分析不同的用户喜好通过机器学习算法对不同性别、年龄阶段的用户进行定制化的电影推荐
3.最后把推荐的电影进行可视化的展示操作

 

 

第二天
下午
大数据算法原理及案例实现(2) 第九讲:航空公司客户价值分析(K-Means实战):
1.基于航空公司客户的历史飞行数据,对数据进行清洗、属性规约、属性构造(构建LRFMC指标)
2.然后根据LRFMC模型对客户进行特征分析
3.通过K-Means聚类算法对不同价值的客户进行细分
4.最后把客户群体的特征进行可视化展示,为不同价值的客户制定个性化营销策略
第十讲:机器学习神器:XGBoost 构建金融反欺诈模型
1.细致讲解 XGBoost算法的核心思想与模型原理
2.包括梯度提升框架、树结构优化、目标函数与正则化机制
3.通过实际金融交易数据集案例,演示特征构建、模型训练与参数调优全过程
4.讲解模型评估指标(AUC、KS 值、召回率、F1 等)在反欺诈系统中的应用意义
5.结合Python与XGBoost库,完成从数据加载、特征处理、模型构建、评估到可视化的完整实战流程

 

 

 

 

第三天
上午 AI对话式数据分析与挖掘实战 第十一讲:Pandas AI通过自然语言交互实现数据分析
1.基于任意结构化数据集(如Excel、CSV),对数据进行清洗、数据转换、特征生成
2.然后根据自然语言指令对数据进行探索性分析
3.通过大型语言模型(LLM)自动生成并执行Python代码,对复杂数据关系进行深度洞察
4.最后把分析结果和图表进行自动化可视化展示
第十二讲: ChatExcel(Excel AI处理方向)
1.自然语言驱动的Excel表格智能处理(ChatExcel实战)实战部分:
2.基于Excel/CSV表格数据,对数据进行清洗、格式转换、多表合并
3.然后根据一句话指令对数据进行智能运算与统计,通过AI模型对复杂函数逻辑进行自动化生成与执行
4.最后把交叉对比结果和数据透视进行即时可视化展示
第十三讲:Julius AI (对话式数据分析助手)
1.核心功能:作为一个对话式数据分析助手,Julius AI允许用户通过上传数据文件(如 CSV、Excel)
2.使用自然语言提问来执行复杂的数据操作、统计分析和可视化。它能够理解上下文,自动生成并执行 Python/R 代码,并以图表和文字洞察的形式返回结果
3.适用场景:快速的探索性数据分析(EDA)、即时数据洞察、非技术人员的数据查询
第三天
下午 数据分析可视化与AI生成数据分析报告
第十四讲:DeepSeek生成图表可视化主题描述
1.DeepSeek大模型驱动的自然语言图表生成与可视化方法论实战部分:
2.基于结构化数据或分析结果,对图表需求进行自然语言描述。
3.然后通过DeepSeek大模型的代码生成能力,自动生成并执行Python可视化代码(如基于Matplotlib、Plotly、Pyecharts等库)
4.实现复杂图表的一键生成,对数据含义进行简洁表达与高效洞察
5.最后把生成图表应用于数据分析报告或Web应用中进行可视化展示
第十五讲:全能AI智能体数据分析与报告撰写(Manus实战)
1.基于多源异构数据(如网页内容、文件、API数据),对数据进行收集、整合、预处理
2.然后根据用户需求对数据进行多维度分析
3.通过AI智能体的多工具协作能力对特定业务问题进行深入研究与建模
4.最后把分析结论、数据图表和研究报告进行专业化文档撰写与交付 

咨询电话:
0571-86155444
咨询热线:
  • 微信:13857108608
联系我们