钢铁生产管理中数据分析需要采用专业的统计软件,既可以实时监控生产流程,也可以直接核算生产效益,尤其是在工业智能化时代,工控系统智能化直接效益关乎钢铁生产企业发展命脉。那么SAS数据挖掘可以直接应用在钢铁生产管理数据集市中,为其提供科学、有效的管理模型,从而提升钢铁生产管理水平,提高生产效率,降低各种管理成本,从而直接提升企业核心竞争力。下面请随笔者一起了解钢铁生产管理数据集市中应用SAS数据挖掘。
钢铁生产管理数据集市中应用SAS数据挖掘
数据集市实现包含数据聚集、数据转化、数据导入,这些过程相互融合,充分利用了已有的生产管理数据仓库和其他操作型环境下的数据,采用“利用已有”和“吸收四围”结合的方法,其中技术质量、生产管理都是企业最关心的问题,结合当前的需求进行建立初始的数据集市,然后根据实际问题和日常变动的动态情况随时扩充完善该数据集市。
1.数据挖掘技术
(1) 数据挖掘的基本步骤
数据挖掘并不是一个简单的过程,其主要步骤归结为:①数据清洗,目的是清除数据噪声以及清除与研究目标显然无关的数据。②数据集成,其过程就是把多方数据源中的相关数据进行组合。③数据转换,其作用就是将数据转换成为数据挖掘所能识别的数据存在形式,即对数据进行一定的格式转换。④数据挖掘,利用挖掘算法寻找用户所需的数据模式或规则以及规律知识。⑤模式评估,根据特定的评估标准筛选出有意义的规则、趋势、类别、模型等。⑥知识表示,对所挖掘出来的模式进行可视化,把挖掘的结果展示给用户。
(2) 数据挖掘模型选择
数据挖掘模型虽然很多,但比较典型的数据挖掘算法主要有:关联分析、序列模式分析、分类分析和聚类分析等[3]。每个模型都有其优缺点,主要是看在具体某一类的问题上哪种算法更有效,这主要取决于问题的类型以及数据的类型、规模。本文联系钢铁生产管理中合同管理主题的实际应用,结合关联规则形式的简洁性、易于解释和理解行以及捕捉数据间重要关系的有效性,选取关联规则分析方法作为本文在生产管理数据集市中的分析研究的数据挖掘方法。
2.SAS 数据挖掘方法
SAS软件不仅提供了包括SAS/EM在内的一系列数据分析组件,而且还提供了自己的数据挖掘方法论即SEMMA:①Sample 即数据取样,抽取有关的数据。②Explore 即对数据子集进行探索和分析,从而找出未知的模式。③Modify 即对数据进行调整和技术的选择。通过①②两个步骤,对数据的状态和趋势就有了一定的了解,问题也有了进一步的明确,这时就需要对数据进行选择、增减、转化、量化等,以便进一步地进行数据挖掘。④Model 即模型开发,选用合适的分析工具,建立模型,进行预测。⑤Assess 即对数据挖掘结果进行评价,看其是否是具有有效性和可靠性。 当然以上步骤也不可能一次完成,其中的某些步骤可能要反复进行。在反复进行的过程中,实现对目标问题的解决方案进行不断的优化。
3.SAS数据挖掘在钢铁生产管理数据集市中的实例应用 某钢铁企业使用SAS软件作为其数据分析和决策支持系统的主流平台,基于SAS的数据挖掘技术已经在该公司的各个领域内得到了很好的应用,并取得了满意的效果。本文选取SAS数据挖掘在该企业生产管理数据集市中的应用作为研究内容。
SAS数据挖掘
在该钢铁企业合同管理中,由于无委托板坯原因导致的合同完成率下降问题在合同管理中一直居高不下(一个合同号对应多个板坯号),而无委托的板坯量相对企业来说也是极大的一种浪费,在生产板坯过程中如何尽可能以最快的速度来减少无委托板坯量进而提高合同完成率是该钢铁企业长久以来所面临的较大难题。本文选定如何快速找出各无委托原因之间的关系,进而降低炼钢中产生的无委托量作为数据挖掘的业务问题。
(1)数据准备
本文收集的数据是从某钢铁企业产销系统中抽取的,因为各钢铁企业的实际生产过程是相似的,所以该数据具有代表性。通过简单除去不需要的字段,剩余字段全部用SAS程序读到数据集市中,以此提高数据抽取的效率,为下文的数据抽取做准备。
(2)数据抽取
从某钢铁企业的生产管理数据集中抽取某天的无委托板坯实际生产数据,通过输入数据源节点读取所需要的数据源,以方便下文数据挖掘过程中进行处理、定义各数据项的属性。
现利用SAS/EM工具提供的解决方案来随机抽取某一天的生产实际数据(余材原因即无委托原因)。
由表1看出,产生无委托的库存量是很大的。那么我们如何快速地解决这个问题?首先要找到各无委托原因之间存在什么关系,然后根据它们之间的关联把这些原因反馈到各负责部门,这样解决问题的能力就大大提高。
(3)数据探索
数据探索就是在数据抽取的基础上,通过简单的统计方法来探索影响板坯库存量和合同管理的无委托各原因的基本情况。数据探索是对数据的初步研究,来探究数据的特殊属性,以便助于为数据挖掘选择合适的数据处理和分析技术。
(4)数据调整
数据调整是利用无委托板坯的实际生产知识对抽取的数据进行加工修改,使之符合无委托板坯的生产实际。
(5)目标变量设定
通过以上分析,由本文的研究内容可知,该数据挖掘的目标是寻找各无委托原因数据的关系。本文把无委托板坯原因设置为目标变量。
总之,SAS数据挖掘应用在钢铁生产管理数据集市中能有效地进行数据分析、发现数据之间的关联、找出数据背后潜在的知识。事实分析可知,根据各无委托原因之间的关联,不仅找到了快速解决无委托板坯量的途径,而且提供了提高完成合同率的解决方法。
欲了解更多,请点击生产管理系统。
温馨提示:
如果您在生产管理系统选购、实施、维护等方面遇到疑难问题,欢迎联系乾元坤和生产管理系统软件开发技术工程师,他们会给您详细的解答, 。