当前位置: 首页 > 内训课程 > 课程内容
广告1
相关热门公开课程更多 》
相关热门内训课程更多 》
相关最新下载资料
工业大数据背景下的 数据分析与建模

工业大数据背景下的 数据分析与建模

课程编号:58921

课程价格:¥0/天

课程时长:2 天

课程人气:58

行业类别:石油化工     

专业类别:大数据 

授课讲师:郭朝辉

  • 课程说明
  • 讲师介绍
  • 选择同类课
【培训对象】
从事数据分析、数据建模的相关技术人员

【培训收益】
本课程面向工业企业,向学员介绍如何利用生产过程产生的实际数据,有效地从事根因分析、数据建模等工作,为企业解决实际问题。

课程分成七个部分

第一部分介绍数据建模和根因分析的基本概念。主要用于纠正学术界常见的错误或模糊观点。在工业企业,人们对过程和对象的理解往往较深,建模中的困难往往是数据条件不理想导致的。 另外,工业人追求模型的实用价值。实用模型不仅需要一定的精度,还对精度的稳定性有较高的要求。模型的实用并不等同于科学意义上的正确,但科学知识有利于提高精度和稳定性。

第二部分介绍数据分析过程中常见的错误。在实践过程中,数据分析的困难往往体现在容易出现错误。这些错误与数据质量密切相关。数据的真实性、数据的误差都可能带来错误、扭曲的分析结果。而现实中,工业数据的质量低是一种常态。传统数据分析要求的“先验条件”往往不存在。工业数据分析需要在这样的前提下开展工作。

第三部分介绍如何避免错误的分析结果。要避免出现分析错误,需要从数据本身的质量入手。要关注数据的采集过程、要审视数据采集的标准。用于分析的数据必须完整,不能片面地描述工业对象和过程。要避免数据收集过程的片面性、避免“幸存者偏差”导致的错误。

第四部分讨论数据的分析方法。数据分析一般从分析相关关系开始。但进行根因分析(或开发控制模型)时,需要确认因果关系。工业对象往往可以看出一个系统,系统中有众多的反馈和前馈回路。这会导致变量之间的相关与因果关系混乱。要解决这类困难,需要将工业知识和数据分析方法有机地结合起来。

第五部分介绍模型和分析结果的验证。验证过程的本质,是验证精度和适用范围。由于工业过程经常面对不可见的干扰,人们往往难以建立高精度的模型。考虑精度时,可以设法排除随机干扰的影响、专注于本质性的影响。分析适用范围时,可以从多个角度、多个场景分别检验。特别需要指出的是:如果模型本身过度复杂,精度和适用范围之间就会产生矛盾。

第六部分介绍一种常见的实用模型。这种模型与教科书上的科学原理差别较大,本质上是经验和实践的积累,是“用历史预报未来”。相关的算法相对简单,但需要较多的数据积累。故而特别适合大数据时代。为了提高模型的精度、保持精度的稳定性,往往需要采用“自学习”和参数调整技术,让现实数据不断地矫正模型。

最后一部分讨论技术经济性。本课程介绍的方法,是实践中行之有效的方法、也是非常传统的做法。但是,在数据条件不理想时,分析和建模的效率很低、成功的比例也很低。这导致相关工作不具备经济性、也难以广泛开展。但是,在工业大数据时代,数据条件发生了变化,技术经济性就不一样了。企业需要主动地创造条件,才能促进这些工作的开展。 

咨询电话:
0571-86155444
咨询热线:
  • 微信:13857108608
联系我们