课程编号:56235
课程价格:¥18000/天
课程时长:2 天
课程人气:123
行业类别:行业通用
专业类别:大数据
授课讲师:刘道军
第1 讲 数据分析基础 数据分析是什么 为什么要做数据分析 数据分析究竟在分析什么 数据分析的常规流程 数据分析工具:Excel 与Python 第2 讲 Python 基础知识 Python 的下载与安装 介绍Jupyter Notebook 第3讲 基本概念 数 变量 标识符 数据类型 输出与输出格式设置 缩进与注释 字符串 数据结构——列表 数据结构——字典 数据结构——元组 运算符 第4讲 语句 循环语句 for 循环 while 循环 条件语句 if 语句 else 语句 elif 语句 函数 普通函数 匿名函数 高级特性 列表生成式 map 函数 模块 第5 讲 Pandas 数据结构 Series 数据结构 DataFrame 表格型数据结构 第6 讲 如何获取数据源 导入外部数据 导入.xlsx 文件 导入.csv 文件 导入.txt 文件 导入sql 文件 新建数据 熟悉数据 第7讲 数据预处理 缺失值处理 重复值处理 异常值的检测与处理 数据类型转换 索引设置 第8讲数据选择 列选择 行选择 行列同时选择 第9讲 数值操作 数值替换 数值排序 数值排名 数值删除 数值计数 唯一值获取 数值查找 区间切分 插入新的行或列 行列互换 索引重塑 长宽表转换 apply()与applymap()函数 第10讲 数据运算 算术运算 比较运算 汇总运算 相关性运算 第11 讲时间序列 获取当前时刻的时间 指定日期和时间的格式 字符串和时间格式相互转换 时间索引 时间运算 第12讲数据分组/数据透视表 数据分组 数据透视表 第13 讲 多表拼接 表的横向拼接 表的纵向拼接 第14讲 结果导出 导出为.xlsx 文件 导出为.csv 文件 将文件导出到多个Sheet 第15 讲 数据可视化 数据可视化是什么 数据可视化的基本流程 图表的基本组成元素 Excel 与Python 可视化 建立画布和坐标系 设置坐标轴 其他图表格式的设置 绘制常用图表 第16讲 大数据的介绍及应用 大数据的基础 大数据应用架构及关键技术 基于大数据应用案例