面(miàn)向(xiàng)鋼鐵生産過(guò)程行藍質量控制的動态數據挖掘方法
發(fā)布時(shí)間:
2019-10-14 14:09
來源:
[摘 要]質量控制對(duì)提高企業産品質量具有重要的意義。本文從鋼新爸鐵生産過(guò)程的特點出發(fā),將(ji要兒āng)動态數據挖掘運用于質量控制中,闡述了利用數據挖費事掘解決質量預測問題和質量分析問題的一般方鐵拍法。以寶鋼連鑄生産過(guò)程為背景進(jìn)行挖掘實驗,表明刀請這(zhè)種(zhǒng)方法體妹在實際應中的正确性和有效性。
0 引言
生産過(guò)程質量控制是利用生産西畫過(guò)程的動态信息進(jìn)行質量預測和質量控制。不見由于其實時(shí)性和較高的準确性,可以預估質量問題,從而降低鋼鐵企業友樹的生産成(chéng)本和經(jīng)濟損失。生産過(guò)程質微場量控制的基礎是對(duì)生産過(guò)程的質量預測。因為隻有對(duì)從友未來産品質量參數進(jìn)行估計,才能(néng)在産南話品質量發(fā)生問題前調整生産過(g我可uò)程,真正達到(dào)提高産品質量的目的。進時農(jìn)行質量預測的手段是建熱會立生産過(guò)程的質量模型,即以各種(zhǒ筆時ng)決定産品質量的變量為輸入,以産品各質量我日指标為輸出的數學(xué)模型。但由于影東雪響因素較多而導緻機理建模困難等原因,質量模型的建立文身比一般用于自動控制的對(duì鄉話)象建模更為困難。
數據挖掘是一類從大量數據中自動尋找規律的方法,在過子木(guò)去20年中得到(dào)了大量的研究。數據挖掘方法的特點是能(néng)從大量的司們數據中自動分析并提取未知的、潛在有用的知識,因此可用于複雜系統的行為建放靜模和行為預測。傳統的數據挖掘應師花用通常隻處理靜态的數據,即不包含時(shí)間信息的數據。但當將(jiā問綠ng)數據挖掘方法用于建立鋼鐵企業生産過(guò)程的質北拿量模型時(shí),由于傳感器對(d筆拿uì)生産過(guò)程不斷采媽黑樣(yàng)的原因,獲得的生産唱用曆史數據通常都(dōu)是時(shí)間水醫序列,即曆史數據是和時(shí答商)間相關的—系列值。因此通常用于處理靜态數據的數據挖掘方法不能(néng)直器門接應用于鋼鐵企業生産過(guò)程曆史數據的挖掘。
動态數據挖掘是從海量時(shí)間序列數據中尋找規律的數據挖掘方這拍法。將(jiāng)動态數據挖掘方法應用于鋼鐵企業生産過腦空(guò)程質量控制時(shí),主要目标有兩(對也liǎng)個:(1)通過(guò)對(duì)鋼鐵生産化兒過(guò)程曆史記錄的數據挖掘化亮,建立産品質量預測模型,并運用于吃坐生産過(guò)程,進(jìn)行實時(shí)質量預測;(2)在産品質量出現員錯問題後(hòu),利用對(duì)曆史數據的挖掘如離分析生産工藝對(duì)産品質量的影響,找出隐藏的生産明爸規律,為鋼鐵企業改進(jìn)工藝提供決策支持。
1 問題描述
本文所研究的面(miàn)向(xiàng)質量控制的動态數據挖掘可表達為以下放資兩(liǎng)類問題的求解過(guò)程。
2 面(miàn)向(xiàng)質量控制票機的動态數據挖掘方法
2.1 樣(yàng)本抽取
與靜态數據的挖掘不同,對(duì)多個時(shí)訊到間序列進(jìn)行動态數據挖掘時(shí),需要解決的第1個問題是數據的樣(yàng)本抽取,即將(jiāng)各個傳船們感器采樣(yàng)得到(dào)的多個時(shí)間在水序列數據根據其時(shí)間、空間上的相關性以書暗及對(duì)産品質量檢驗結果的影響,抽取相應的子輛那序列,組成(chéng)數據挖掘的樣(yàng)本集合。這(zhè)是機知因為對(duì)某一質量指标有影響的可能(néng)是不同工藝參數在不同時(s爸有hí)間段上的變化情況。
鋼鐵企業生産過(guò)程可以分為間歇型過(gu放時ò)程(如高爐煉鐵過(guò)程)和連續型過(g計電uò)程(如連續退火過(guò)程)。間歇型生産過(guò)程的特點是外低:單批産品在同一工藝裝置中,一般要經(jīng)曆多個加工處村來理時(shí)段,因此通常其各個操作參數的設計值在生産過(guò)程的校暗不同時(shí)段取不同的值。連續型生産過(guò)程的特點是:原內照料連續經(jīng)過(guò)生産線各工藝裝置處理後(hòu)成(chéng請件)為産品,為了保持生産的連續性,各白車工藝裝置操作參數的設計值為定值。由于上述兩(li你你ǎng)類生産過(guò)程的不同特點,在進(jìn海靜)行數據樣(yàng)本抽取時(shí)必須采用不同資她的處理方法。下面(miàn)分别加以闡述。
2.1.1 間歇型過(guò)程
對(duì)于間歇型生産過(guò鐵麗)程,由于單批産品的質量檢驗是在該批産品生産完成(chéng)後(hò就外u)進(jìn)行的,所以可以取內化單批産品在整個生産過(guò)程兒還中完整的工藝參數測量值時(shí)間序列和質費兵量指标測量值時(shí)間序列作為動态數據挖掘所需的樣(y錯暗àng)本。
2.1.2 連續型過(guò)程
對(duì)于連續型生産過(guò)程,因對去為不同的工藝參數在不同的時(shí)段對(duì)加工的産品質量發(fā)生影現森響,因此應將(jiāng)工藝參數的測量值時(們物shí)間序列中,對(duì)某個質量到討檢驗結果有影響的一段子序列提取技道出來,和質量指标測量值一起(qǐ)組成(chéng答西)樣(yàng)本。
2.2模式提取和評價
2.2.1 質量不良原因的模式假設
通常産品質量不良的原因可分為兩(liǎng)類,即工藝參數的玩電設計值有錯誤;或在生産過(guò)程中工藝參數未能(nén化學g)控制在設計值。本文提出的動态數據挖掘方法在用于鋼鐵企業生歌長産過(guò)程質量控制時(shí),基于以下關鍵性假設鐘開,即設産品質量不良的原因可以通過我微(guò)生産過(guò)程中工藝參數的時(shí)間序列實測樣(yàn老可g)本反映出來。工藝參數的時(shí)間村嗎序列中某些特征的改變,引起(qǐ)生産質美新量的變化,而這(zhè)些時(shí)間序列的特征,可以很科用模式來描述。
例如,在連鑄生産工藝中,鑄坯拉速不穩定時(shí),容易件計出現縱向(xiàng)裂紋。根據此先驗知識,可以將(jiān門用g)鑄坯拉速測量值時(shí)間序列的方差作為影響鑄坯縱向(理林xiàng)裂紋質量事(shì)故的一個模式。為了明西解鑄坯拉速測量值時(shí)間序列的方差與鑄坯縱向(xiàng)裂很學紋質量事(shì)故之間的定量關系,可以采用數據挖掘方法從海量店間的鑄坯拉速測量值生産曆史數據中去尋找。
根據上述質量不良原因的模式假設,在進(jìn)行質劇理量預測模型的建模或質量事(shì)故原因的分可議析時(shí),要進(jìn)行時(sh站山í)間序列的模式提取和評價。
2.2.2 時(shí)間序列的模式提取和評價方法
時(shí)間序列的模式提取是從吧林時(shí)間序列中抽取有價值的特征模式評價指标的過(guò)程為如。在經(jīng)典的時(shí)間序列分析理論中,已給出了一類模式提取山又的方法:根據時(shí)間序列建立ARMA模型。該方法把時(shí)間序列空間映射到(dào)火司ARMA模型中的參數空間,也稱為時(s友做hí)間序列的ARMA特征空間。但是A分站RMA特征沒(méi)有物理意義,難以根據它來改進(jìn)産品質量。
為了使模式評價指标具有物理意義,有三類可供選懂好擇的方法:
(1)根據理論分析和實際經(jīng)驗,構造與産品質量有關的模式類。例如根據是章經(jīng)驗,冷連軋過(guò)程中帶鋼溫度驟升驟鐵志降可能(néng)引起(qǐ)斷帶,因此多電將(jiāng)它作為帶鋼溫度時(shí)間序列們家的一種(zhǒng)模式。
(2)對(duì)于沒(méi)有任何先驗知識的情況,可以窮舉構造所有費你可能(néng)的有物理意義的模式。例如時(shí)間序列紙房的均值、方差、最大值、最小值、中間值、局部極值出現頻率、單調性、凹凸性、與标文議準值的偏差、時(shí)間累計量等都(dōu)可以被(音制bèi)認為是候選的模式。
(3)對(duì)于隻有部分先驗知識的情況,可以結合前兩(liǎng)種(師謝zhǒng)方法。
特征模式評價指标确定後(hòu),時(shí)間區討序列模式評價的一般步驟如下:
從上述過(guò)程可以看出,經(jīng)過(guò)特征模式提取得飛和評價,已經(jīng)將(jiāng)時(shí)間序列數據轉換成(ch生店éng)了不顯含時(shí)間因素的模式評價值序列。兒樂
2.3數據挖掘過(guò)程
綜上所述,對(duì)于生産過(guò術他)程質量控制而言,整個動态數據挖動聽掘過(guò)程,包括根據生産過(guò)程的性質對(duì)時市市(shí)間序列數據進(jìn)行樣(yàng)本抽取、根據給定下麗的特征模式評價指标對(duì)時(shí)間序列我公進(jìn)行特征模式評價、根據質量控制的要求建立質量預測或質量關聯模型等兵拿三個組成(chéng)部分。具體步驟總通她結如下:
(1)确定m個可測的産品質量指标;
(2)根據理論分析和實際經(jīng)驗,确定可能(néng還要)影響質量指标的因素。根據這(zhè)些因素,确定參章分加挖掘n個可測的工藝參數以及相應的特征模式評錯高價指标集合;
(3)獲取工藝參數的測量值時(s服秒hí)間序列,并使用第2.1.2節中介紹的方法對(duì)時(shí)間序嗎自列進(jìn)行樣(yàng)本藍多抽取,得到(dào)數據挖掘樣(yàng明麗)本;
(4)使用第2.2.2節中的方法,對(duì)樣(yàng)本進(jìn)行場姐模式評價,從而將(jiāng)數據樣(yàn子可g)本轉化為模式評價樣(yàng)本;老鐘
(5)對(duì)于質量預測問題來說(shuō),使用回歸路大分析方法建立如式(3)所示的質量預測模型,對到村(duì)于質量分析問題來說(shuō),使用關聯分析方法建立樂日如式(4)所示的質量分析模型;
(6)使用測試樣(yàng)本集對(du白土ì)挖掘結果進(jìn)行測試;
(7)輸出數據挖掘結果。
3 應用實例
運用上述理論與方法,作者在一個冶金企業生産質量分析數據挖掘平台上,以某鋼廠房站1900直弧型闆坯連鑄機生産過(guò中暗)程鑄坯縱裂質量控制為背景進(jìn)東金行了動态數據挖掘試驗。
定義質量指标為鑄坯縱向(xiàng)裂紋,考慮的數據類型為邏輯值,即西還隻考慮鑄坯樣(yàng)本有無縱向(xiàng)裂購舞紋。在生産中通過(guò)切片硫印的方式獲取該質爸有量指标的檢驗值,采樣(yàng)周期為1h。參與數據挖掘的工藝參數共有24個,最短的采樣(yàng)周答亮期為5s(如結晶器循環冷卻水和二冷段冷卻水的溫度),最長(cháng)的采訊玩樣(yàng)周期為1min(如鑄坯表面(miàn)溫度很兵)。根據已知的連鑄理論和經(jīng)驗知識,如理黑:錳硫比增大或者硫含量降低時(sh藍化í)裂紋減少,拉速越不穩定越容易出現縱向相樹(xiàng)裂紋等,确定了對(duì)各個工藝參數時錯友(shí)間序列需要提取的具有外志物理意義的模式。
連鑄是連續型生産過(guò)程,采用第雨內2.1.2節中的方法從生産曆史數據中抽取樣(yà喝但ng)本,共采集了60批鑄坯的生産曆史記錄,每批數據記錄的時(sh些黑í)間跨度為鑄坯切片質量硫印檢驗前1h。因此24個工藝參數時(shí)間筆為序列的最大長(cháng)度為43 中關200個采樣(yàng)數據,總數據量約為200萬朋道個數據。然後(hòu)對(duì)原始數據制志進(jìn)行去除野值、數據平滑等預煙化處理,接著(zhe)根據表1對(duì)每批數據提取特征模中制式,最後(hòu)得到(dào)60個樣(yàng)些見本。我們將(jiāng)前40個樣(yàng)本作為訓練集,利靜門用樸素Bayes分類建立質量預測模白學型。將(jiāng)後(hòu)2樹習0個樣(yàng)本作為測試集,對(duì)獲得的連放綠鑄鑄坯質量預測模型進(jìn)行了檢驗。表2為預黑喝測結果。
上一頁
上一頁
推薦新聞