大規(guī)模的數(shù)據(jù)應(yīng)用和平臺(tái)架構(gòu)在政府、金融、電信等行業(yè)已經(jīng)經(jīng)歷了充分的驗(yàn)證,所以在工業(yè)智能領(lǐng)域大致會(huì)有類似的演進(jìn)路線,但具體到細(xì)節(jié)里又處處不同,值得細(xì)細(xì)品味。
首先,數(shù)據(jù)在哪里?
一類是管理數(shù)據(jù):結(jié)構(gòu)化的SQL數(shù)據(jù)為主,如產(chǎn)品屬性、工藝、生產(chǎn)、采購、訂單、服務(wù)等數(shù)據(jù),這類數(shù)據(jù)一般來自企業(yè)的ERP、SCM、PLM甚至MES等系統(tǒng),數(shù)據(jù)量本身不大,卻具有很大的挖掘價(jià)值;
另一類則是機(jī)器運(yùn)行和IoT的數(shù)據(jù):以非結(jié)構(gòu)化、流式數(shù)據(jù)居多,如設(shè)備工況(壓力、溫度、振動(dòng)、應(yīng)力等)、音視頻、日志文本等數(shù)據(jù),這類數(shù)據(jù)一般采集自設(shè)備PLC、SCADA以及部分外裝傳感器(裝什么?怎么裝?),數(shù)據(jù)量很大,采集頻率高(一般在ms級(jí)),需要結(jié)合邊緣計(jì)算在本地做一些預(yù)處理;
總的來講,由于場(chǎng)景的割裂和分散,工業(yè)數(shù)據(jù)本身具有量大、多源、異構(gòu)、實(shí)時(shí)性要求高等特點(diǎn),而且隨著未來280億設(shè)備逐步接入,這些特性將會(huì)進(jìn)一步加強(qiáng),這是做工業(yè)大數(shù)據(jù)服務(wù)的核心難點(diǎn)之一,和互聯(lián)網(wǎng)大數(shù)據(jù)不僅量級(jí)不同,結(jié)構(gòu)不同,應(yīng)用也完全不同。舉個(gè)簡(jiǎn)單的例子,互聯(lián)網(wǎng)場(chǎng)景中我們常用的是推薦算法,相關(guān)性分析等等,但是到了工業(yè)場(chǎng)景,很多機(jī)器數(shù)據(jù)需要做頻譜分析、歸因分析,這是完全不同的兩個(gè)方向。
其次,基于這些工業(yè)數(shù)據(jù),平臺(tái)層應(yīng)該提供哪些服務(wù)?
完整的協(xié)議解析:數(shù)據(jù)采集首先要完成工業(yè)協(xié)議的打通,這部分工作不算太難,但需要花費(fèi)人力和時(shí)間,是真正的苦活、累活,往往是不想做但又不能不做,當(dāng)然,反過來講,各種協(xié)議的打通和支持本身也是服務(wù)客戶的壁壘之一。以應(yīng)用層協(xié)議為例,EtherNet/IP和PROFINET的市場(chǎng)占有率最大,其中PROFINET主要市場(chǎng)在歐洲,EtherNet/IP主要在美國。其次是EtherCAT、Modbus-TCP和EtherNetPOWERLINK這些。
標(biāo)準(zhǔn)化的數(shù)據(jù)整合:采集上來的數(shù)據(jù)要做統(tǒng)一的主數(shù)據(jù)管理,第一步是建立標(biāo)準(zhǔn)。一般來講,我們先要用ISO或其他業(yè)內(nèi)標(biāo)準(zhǔn),制定統(tǒng)一的編碼、結(jié)構(gòu)、流轉(zhuǎn)方式和屬性,確保數(shù)據(jù)的一致性,這一點(diǎn)非常重要。其次,要在項(xiàng)目實(shí)施的歷程中,逐步積累行業(yè)知識(shí)庫、合適的算法組件以及相關(guān)機(jī)理模型,這一點(diǎn)也很重要,這是從數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)化到業(yè)務(wù)標(biāo)準(zhǔn)化的關(guān)鍵一步,是為實(shí)現(xiàn)真正的產(chǎn)品層面的微服務(wù)化打下基礎(chǔ)。
強(qiáng)大的PaaS支持:工業(yè)數(shù)據(jù)本身的特殊性導(dǎo)致平臺(tái)必須要有強(qiáng)大的中層支撐能力。我們以時(shí)序數(shù)據(jù)庫為例,最近,阿里云發(fā)布了商用版本的高性能時(shí)間序列數(shù)據(jù)庫 (High-Performance Time Series Database) 。所謂時(shí)序數(shù)據(jù),是帶有時(shí)間戳的一系列數(shù)值,時(shí)序數(shù)據(jù)是工業(yè)數(shù)據(jù),尤其是設(shè)備工況和傳感器數(shù)據(jù)的典型品種。這類數(shù)據(jù)頻率高、量大,用傳統(tǒng)關(guān)系型數(shù)據(jù)庫處理,需要每次把所有值拉出來計(jì)算,吞吐量極大,性能很差。所以,一個(gè)高壓縮、高性能的時(shí)序數(shù)據(jù)庫,就是平臺(tái)層必備的能力之一。
最后,我們應(yīng)該做哪些應(yīng)用?
設(shè)備級(jí):質(zhì)量控制。為了避免產(chǎn)線宕機(jī),工廠的傳統(tǒng)做法是對(duì)設(shè)備或核心零部件做定期的更換或檢修,這種做法往往不能解決問題,而且會(huì)造成浪費(fèi)。在工業(yè)智能時(shí)代,如果我們能夠采集到合適的實(shí)時(shí)數(shù)據(jù),結(jié)合該設(shè)備所適用的機(jī)理模型,就有可能用機(jī)器學(xué)習(xí)的方法挖掘出產(chǎn)品質(zhì)量與關(guān)鍵數(shù)據(jù)之間的關(guān)聯(lián)或因果關(guān)系,也就有可能實(shí)現(xiàn)實(shí)時(shí)在線的質(zhì)量控制和故障預(yù)警,如果數(shù)據(jù)頻率能對(duì)工藝流程形成完美包絡(luò),我們還有可能實(shí)現(xiàn)最大限度的效率提升。
廠級(jí):計(jì)劃排產(chǎn)。工業(yè)智能的最終目的是要實(shí)現(xiàn)大規(guī)模的個(gè)性化定制,即C2M。從工廠計(jì)劃排產(chǎn)的角度來看,這其實(shí)是一個(gè)數(shù)學(xué)問題。這一問題的目標(biāo)是實(shí)現(xiàn)當(dāng)時(shí)當(dāng)?shù)氐漠a(chǎn)能最優(yōu),約束條件來自企業(yè)的產(chǎn)線設(shè)備、人員、產(chǎn)品屬性、供應(yīng)鏈數(shù)據(jù)等等,通過歷史數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,不難形成一個(gè)較好的預(yù)測(cè)模型。這一模型能根據(jù)產(chǎn)線和工廠的實(shí)時(shí)數(shù)據(jù)動(dòng)態(tài)分析,動(dòng)態(tài)調(diào)整,以幫助企業(yè)實(shí)現(xiàn)準(zhǔn)確把控,最大化經(jīng)濟(jì)效益。
在可以預(yù)見的未來,隨著數(shù)據(jù)的完整性和可靠性越來越高,場(chǎng)景越來越豐富,數(shù)據(jù)應(yīng)用層面會(huì)誕生相當(dāng)多的優(yōu)先企業(yè),他們幫助工業(yè)用戶降低成本,提高效率,能解決實(shí)實(shí)在在的業(yè)務(wù)問題。目前來看,無論是阿里云所謂的ET工業(yè)大腦、三一的根云,海爾的COSMOPlat,甚至富士康的BEACON,等在往這一方向努力,數(shù)據(jù)能驅(qū)動(dòng)的,絕不只是信息的加速流通,未來一定是業(yè)務(wù)全流程的重構(gòu),讓我們拭目以待。
(審核編輯: 智匯胡妮)