工業(yè)大數(shù)據(jù)建設(shè)的終極目標(biāo)是消除不確定性
點擊:2072
A+ A-
所屬頻道:新聞中心
在我看來,質(zhì)量管理的一個重要思想,是將產(chǎn)品設(shè)計、質(zhì)量要求、設(shè)備狀態(tài)、工藝控制等看成概率問題。在這個思想的指導(dǎo)下,標(biāo)準(zhǔn)的制定普遍增加了對公差的指標(biāo)要求。這樣,就把質(zhì)量管理聚焦到對不確定因素的度量和控制。
這個思想還意味著:偏差或者缺陷率小到規(guī)定的范圍之后,就不再去追去它的原因了。“不去追究原因”其實常常是不得已而為之。在數(shù)據(jù)不完整的前提下,很多問題的原因根本無法去追究。
在鋼鐵生產(chǎn)過程中,連鑄坯的質(zhì)量缺陷就是一個典型。連鑄坯缺陷一直是個很難控制的問題。對于用戶要求比較高的產(chǎn)品,常常要全面清理。這樣的代價是很大的。我們當(dāng)然希望只清理有缺陷的產(chǎn)品。但由于坯子的表面很粗糙,很多缺陷不能在線準(zhǔn)確檢測。
于是,人們希望能夠根據(jù)板坯生產(chǎn)的工藝參數(shù),準(zhǔn)確預(yù)測缺陷的產(chǎn)生。但很多缺陷只能在最終產(chǎn)品上、甚至用戶使用時才能發(fā)現(xiàn)。在這個過程中,有些中間環(huán)節(jié)可能會把缺陷消除掉、有些雖然坯子有缺陷但在產(chǎn)品上顯現(xiàn)不出來或者用戶基本不在乎。而且,缺陷位置和當(dāng)時的生產(chǎn)參數(shù)、設(shè)備狀態(tài)也難以準(zhǔn)確對應(yīng)。這些都讓我們無法將工藝參數(shù)和缺陷的產(chǎn)生對應(yīng)起來。
這種現(xiàn)象的本質(zhì)是:信息不足導(dǎo)致不確定性。信息不足的不確定性,導(dǎo)致分析結(jié)果的不確定性。分析結(jié)果的不確定性大到一定程度,分析結(jié)果根本無法用來創(chuàng)造價值。設(shè)想一種典型的情況:
某鋼種缺陷發(fā)生率5%。我們把能拿到的數(shù)據(jù)都來建模。最終發(fā)現(xiàn):在某種最嚴(yán)重的條件下,缺陷發(fā)生率8%;在最好的情況下,缺陷發(fā)生率3%。這就是一個無用的結(jié)果:對于質(zhì)量要求高的產(chǎn)品,不論缺陷率8%還是3%,都要進(jìn)行清理;對質(zhì)量要求低的產(chǎn)品,不論8%還是3%,都不需要清理。
很多沒有搞過數(shù)據(jù)分析的人,總希望模型精度非常高。但是,建模所依據(jù)的數(shù)據(jù)不完整、質(zhì)量不高,就不可能得到高精度的預(yù)報結(jié)果——因為任何算法都不能讓原始數(shù)據(jù)的信息量增加。極端的情況是:生產(chǎn)過程沒有任何的檢測和數(shù)據(jù)記錄,數(shù)據(jù)分析能力再強(qiáng)也沒有辦法建立出理想的數(shù)學(xué)模型。還有一種特殊情況,數(shù)據(jù)基本完備但精度不夠。這時,即便是完全正確的模型也只能預(yù)報一個概率分布——這個觀念我強(qiáng)調(diào)了很多年,但真正能理解的人極少。
現(xiàn)在回到本文的開頭:應(yīng)該怎樣建設(shè)工業(yè)大數(shù)據(jù)的基礎(chǔ)。本人認(rèn)為,理想的工業(yè)大數(shù)據(jù)就是針對特定問題(如板坯的質(zhì)量缺陷),建立“全息”的數(shù)據(jù)映像。這時,根據(jù)已有的數(shù)據(jù),是否發(fā)生特定問題是個確定性的。這或許是個永遠(yuǎn)都無法實現(xiàn)的理想,卻是我們追求的方向。
(審核編輯: 智匯小蟹)