工業(yè)領(lǐng)域切入大數(shù)據(jù)是一件很有意思的事情,在我們開展的時候,如果是用計算機的人去搞工業(yè)大數(shù)據(jù)的時候,會發(fā)現(xiàn)很多的障礙,很多搞自動控制的領(lǐng)域也發(fā)現(xiàn)障礙,為什么,這恰恰是由于工業(yè)大數(shù)據(jù)的特性。
1、工業(yè)大數(shù)據(jù)的本質(zhì)
工業(yè)大數(shù)據(jù)的本質(zhì)是以數(shù)據(jù)形式呈現(xiàn)的“信息”或者“知識”,而不是沒有關(guān)聯(lián)的數(shù)據(jù)?!靶畔ⅰ焙汀爸R”的本質(zhì)接近,差別在于:“知識”在時空上的更具有更強的通用性和連續(xù)性。沒有關(guān)聯(lián)的數(shù)據(jù)是垃圾。
2、工業(yè)大數(shù)據(jù)的核心價值
工業(yè)大數(shù)據(jù)的核心價值是知識的重用。大數(shù)據(jù)帶來的好處是:獲得知識的成本低、范圍廣、質(zhì)量高。智能化使得知識在人機之間共享、促進了知識價值體現(xiàn);互聯(lián)網(wǎng)讓知識的價值倍增。知識價值的提高,會讓人們值得花更大的力氣去發(fā)現(xiàn)價值、形成大數(shù)據(jù)工作的良性循環(huán),讓知識工作的價值暴增。
3、知識來源
最好的做法是:數(shù)據(jù)就是知識,如產(chǎn)品設(shè)計的結(jié)果。其次,是讓數(shù)據(jù)(信息)很容易地提煉出知識。再次,是盡量讓數(shù)據(jù)包含知識。最差的做法是:數(shù)據(jù)是垃圾、數(shù)據(jù)之間的聯(lián)系消失、不包含知識。由此觀之,從知識的角度看,數(shù)據(jù)的準(zhǔn)備過程,可能比分析過程更加重要。
4、數(shù)據(jù)分析是知識的獲取過程。
但獲取什么知識,服從于業(yè)務(wù)需求的。所有需要用到數(shù)據(jù)分析的地方,首要任務(wù)和工作重點,是理清業(yè)務(wù)需求的脈絡(luò)和邏輯,把業(yè)務(wù)需求轉(zhuǎn)化成一個便于分析的數(shù)學(xué)問題。而不是隨便拿來一堆數(shù)據(jù)來亂分析。
5、最初的大數(shù)據(jù)關(guān)注數(shù)據(jù)的二次應(yīng)用
數(shù)據(jù)來源服從于一次應(yīng)用的需求。但隨著大數(shù)據(jù)的發(fā)展,二次應(yīng)用本身變得非常重要。一次應(yīng)用和二次應(yīng)用的界限會變得模糊。
(審核編輯: 智匯胡妮)