当前位置: 首页 > 内训课程 > 课程内容

工业大数据背景下的数据分析与建模

课程编号：58921

课程价格：￥0/天

课程时长：2 天

课程人气：509

行业类别：石油化工

专业类别：大数据

授课讲师：郭朝辉

课程说明
讲师介绍
选择同类课

【培训对象】
从事数据分析、数据建模的相关技术人员

【培训收益】
本课程面向工业企业，向学员介绍如何利用生产过程产生的实际数据，有效地从事根因分析、数据建模等工作，为企业解决实际问题。

课程分成七个部分

第一部分介绍数据建模和根因分析的基本概念。主要用于纠正学术界常见的错误或模糊观点。在工业企业，人们对过程和对象的理解往往较深，建模中的困难往往是数据条件不理想导致的。另外，工业人追求模型的实用价值。实用模型不仅需要一定的精度，还对精度的稳定性有较高的要求。模型的实用并不等同于科学意义上的正确，但科学知识有利于提高精度和稳定性。

第二部分介绍数据分析过程中常见的错误。在实践过程中，数据分析的困难往往体现在容易出现错误。这些错误与数据质量密切相关。数据的真实性、数据的误差都可能带来错误、扭曲的分析结果。而现实中，工业数据的质量低是一种常态。传统数据分析要求的“先验条件”往往不存在。工业数据分析需要在这样的前提下开展工作。

第三部分介绍如何避免错误的分析结果。要避免出现分析错误，需要从数据本身的质量入手。要关注数据的采集过程、要审视数据采集的标准。用于分析的数据必须完整，不能片面地描述工业对象和过程。要避免数据收集过程的片面性、避免“幸存者偏差”导致的错误。

第四部分讨论数据的分析方法。数据分析一般从分析相关关系开始。但进行根因分析（或开发控制模型）时，需要确认因果关系。工业对象往往可以看出一个系统，系统中有众多的反馈和前馈回路。这会导致变量之间的相关与因果关系混乱。要解决这类困难，需要将工业知识和数据分析方法有机地结合起来。

第五部分介绍模型和分析结果的验证。验证过程的本质，是验证精度和适用范围。由于工业过程经常面对不可见的干扰，人们往往难以建立高精度的模型。考虑精度时，可以设法排除随机干扰的影响、专注于本质性的影响。分析适用范围时，可以从多个角度、多个场景分别检验。特别需要指出的是：如果模型本身过度复杂，精度和适用范围之间就会产生矛盾。

第六部分介绍一种常见的实用模型。这种模型与教科书上的科学原理差别较大，本质上是经验和实践的积累，是“用历史预报未来”。相关的算法相对简单，但需要较多的数据积累。故而特别适合大数据时代。为了提高模型的精度、保持精度的稳定性，往往需要采用“自学习”和参数调整技术，让现实数据不断地矫正模型。

最后一部分讨论技术经济性。本课程介绍的方法，是实践中行之有效的方法、也是非常传统的做法。但是，在数据条件不理想时，分析和建模的效率很低、成功的比例也很低。这导致相关工作不具备经济性、也难以广泛开展。但是，在工业大数据时代，数据条件发生了变化，技术经济性就不一样了。企业需要主动地创造条件，才能促进这些工作的开展。

郭朝晖博士,教授级高工
1968年生于山东济南。1990、1994和1997年分别在浙江大学应用数学、化学工程、工业自动化专业获得学士、硕士和博士学位。

1997年加盟宝钢。2000年即获得宝钢首次颁发的企业最高荣誉“金牛奖章”。2002年至2017年担任宝钢研究院首席研究员，期间多次获得宝钢重大科技奖。2003年，牛津大学访问学者。2005年晋升教授级高工。著有《管中窥道：技术创新的观念与方法》、《知行：工业基因的数字化演进》。

现为上海优也信息科技有限公司首席科学家。是上海交通大学、浙江大学、东北大学、上海财经大学、西安科技大学等多家高校的兼职教授，清华大学工业大数据实验室、工信部工业大数据分析与集成应用重点实验室等多家实验室的专家委员会委员；中国钢铁行业协会行业培训专家、中国工业互联网产业联盟大数据特设组副主席、工业技术软件化产业联盟专家委员会委员。担任广东省、湖南省、贵州省、山西省、北京市、杭州市、深圳市、泰安市等多个地方（与数字化相关的）专家委员会委员。

曾担任中国工业与应用数学学会副理事长、中国现场统计学会理事、上海市人工智能学会理事，以及中国自动化学会、中国金属学会若干专委会委员。曾担任中央企业青联委员、上海市知识分子联谊会理事、宝钢知识分子联谊会会长、上海宝山区知识分子联谊会副会长、宝山区政协委员。

工业大数据背景下的 数据分析与建模

工业大数据背景下的数据分析与建模