大數(shù)據(jù)產(chǎn)業(yè)發(fā)展?fàn)顩r及政策思考
點擊:2136
A+ A-
所屬頻道:新聞中心
1、引言
當(dāng)前,全球大數(shù)據(jù)產(chǎn)業(yè)日趨活躍,技術(shù)演進(jìn)和應(yīng)用創(chuàng)新加速發(fā)展,各國政府戰(zhàn)略布局和行動不斷推進(jìn)。我國已形成了一定的應(yīng)用、技術(shù)和產(chǎn)業(yè)基礎(chǔ),面臨難得的發(fā)展機(jī)遇,但也存在數(shù)據(jù)、技術(shù)、法律環(huán)境等一系列問題。如何抓住機(jī)遇,將我國擁有的數(shù)據(jù)資源轉(zhuǎn)化為經(jīng)濟(jì)發(fā)展動力,是當(dāng)前的緊迫課題。應(yīng)把握大數(shù)據(jù)發(fā)展的基本規(guī)律,加強(qiáng)頂層設(shè)計,統(tǒng)籌謀劃大數(shù)據(jù)應(yīng)用、關(guān)鍵技術(shù)研發(fā)和擴(kuò)散、產(chǎn)業(yè)培育、數(shù)據(jù)開放與數(shù)據(jù)保護(hù)、市場監(jiān)管、法律法規(guī)等關(guān)鍵布局,系統(tǒng)推進(jìn)我國大數(shù)據(jù)發(fā)展。
2、國外大數(shù)據(jù)發(fā)展?fàn)顩r趨勢
(1)大數(shù)據(jù)產(chǎn)業(yè)發(fā)展極度活躍
大數(shù)據(jù)在資本市場大受追捧,成為產(chǎn)業(yè)興起的風(fēng)向標(biāo)。一方面產(chǎn)業(yè)巨頭積極通過研發(fā)+ 并購的策略加緊布局大數(shù)據(jù)產(chǎn)業(yè),僅IBM 一家就收購了30多家大數(shù)據(jù)公司,未來3 年還計劃再投入145 億美元。微軟、SAP 、EMC、Oracle、Yahoo、Twitter 、沃爾瑪?shù)纫捕碱l頻出手,通過并購增強(qiáng)大數(shù)據(jù)能力。另一方面,VC也很踴躍,據(jù)GP Bullhound、CB Insights 等機(jī)構(gòu)粗略統(tǒng)計,全球2013年大數(shù)據(jù)融資案數(shù)量和額度都比2012年翻了兩番。
●從產(chǎn)業(yè)規(guī)???,大數(shù)據(jù)還處于發(fā)展早期階段
一般認(rèn)為,大數(shù)據(jù)產(chǎn)業(yè)包含硬件、軟件和服務(wù)3 個部分。據(jù)Wikibon公司2014年年初發(fā)布的報告,2013年全球大數(shù)據(jù)相關(guān)硬件、軟件和服務(wù)市場規(guī)模為181億美元,同比增幅長了61% ,增速是同期IT 產(chǎn)業(yè)的6倍。預(yù)計2017年市場規(guī)模將達(dá)到470 億美元,年度復(fù)合增長率將維持在30%以上。
●從產(chǎn)業(yè)構(gòu)成看,大數(shù)據(jù)的硬件定制化和軟件服務(wù)化成為明顯趨勢
硬件和服務(wù)成為大數(shù)據(jù)產(chǎn)業(yè)中產(chǎn)值的主角,各占約40% ,大數(shù)據(jù)軟件只占20% 。在硬件方面,由于大數(shù)據(jù)往往要追求軟、硬件聯(lián)合優(yōu)化,硬件定制化程度要求很高,以定制化ODM模式生產(chǎn)的服務(wù)器占2012年大數(shù)據(jù)服務(wù)器總產(chǎn)值的57% ,2013預(yù)計將更高。此外,公共云計算逐步成為企業(yè)大數(shù)據(jù)處理的優(yōu)先選擇,亞馬遜的彈性MapReduce、谷歌的BigQuery 和微軟的HDI -nsight 等基于云計算的大數(shù)據(jù)分析服務(wù)陸續(xù)推出,推動大數(shù)據(jù)軟件從發(fā)展之初就走上了服務(wù)化道路。
(2)互聯(lián)網(wǎng)公司引領(lǐng)大數(shù)據(jù)技術(shù)前沿突飛猛進(jìn)全球來看,大數(shù)據(jù)技術(shù)創(chuàng)新水平極不均衡,少數(shù)互聯(lián)網(wǎng)公司遙遙領(lǐng)先,技術(shù)創(chuàng)新呈3 個階梯。
●第一梯隊以谷歌為代表,在大數(shù)據(jù)技術(shù)上處于絕對領(lǐng)先地位
谷歌公司憑借其強(qiáng)大的基礎(chǔ)設(shè)施、豐富的數(shù)據(jù)資源和小步快跑的迭代開發(fā),繼2003—2006年推出GFS 、BigTable 和MapReduce 后,2012—2013年又相繼推出新的“三駕馬車”,即Caffeine、Pregel、Dremel 。谷歌累計發(fā)表大數(shù)據(jù)領(lǐng)域的學(xué)術(shù)論文2000多篇,為業(yè)界輸出了大量原創(chuàng)技術(shù)。
●第二梯隊是Yahoo、Facebook 、Twitter 等一大批互聯(lián)網(wǎng)企業(yè)
他們積極利用開源社區(qū),能夠迅速將原創(chuàng)技術(shù)與自身的工程實踐相結(jié)合,開發(fā)了Hadoop等大量開源軟件,極大降低了整個業(yè)界進(jìn)入大數(shù)據(jù)領(lǐng)域的技術(shù)門檻。
●第三梯隊是IBM 、Oracle 等傳統(tǒng)IT 廠商
他們能夠在開源技術(shù)基礎(chǔ)上進(jìn)行改進(jìn),與行業(yè)應(yīng)用系統(tǒng)緊密結(jié)合,快速形成一般企業(yè)可直接使用的商用產(chǎn)品。這種技術(shù)創(chuàng)新的不均衡狀況在各國普遍存在,特別是在醫(yī)療、教育和科研等公共領(lǐng)域的大數(shù)據(jù)技術(shù)相對滯后。
(3)大數(shù)據(jù)應(yīng)用逐漸落地,加速向傳統(tǒng)產(chǎn)業(yè)延伸
●互聯(lián)網(wǎng)是大數(shù)據(jù)應(yīng)用最深入的領(lǐng)域
目前,已經(jīng)產(chǎn)生了搜索、精準(zhǔn)廣告、智能推薦等一批成熟的大數(shù)據(jù)應(yīng)用模式。搜索引擎自2000年左右誕生時就是典型的大數(shù)據(jù)應(yīng)用,其核心要對全球上千億網(wǎng)頁按照權(quán)重進(jìn)行排序,需要強(qiáng)大的底層存儲和計算能力才能支撐,直接催生了MapReduce 等一系列分布式技術(shù)。廣告是互聯(lián)網(wǎng)當(dāng)前最主要的商業(yè)模式,2010年以來興起的實時競價廣告能夠根據(jù)大數(shù)據(jù)將用戶特征與廣告精確匹配,提供廣告精準(zhǔn)程度。利用大數(shù)據(jù)分析結(jié)果開展精準(zhǔn)營銷也已經(jīng)成為電商平臺的標(biāo)準(zhǔn)配置,通過分析用戶數(shù)據(jù)后向用戶推薦商品,亞馬遜等40% 以上交易是靠個性推薦轉(zhuǎn)化的。2013年,互聯(lián)金融爆發(fā)式發(fā)展,成為互聯(lián)網(wǎng)大數(shù)據(jù)擁有者向傳統(tǒng)行業(yè)延伸的急先鋒。據(jù)報道,阿里小額貸款不良貸款率為1.02%,是銀行1/5,成本不到銀行的1/400。
●互聯(lián)網(wǎng)之外,電信業(yè)有望成為大數(shù)據(jù)應(yīng)用最先落地的領(lǐng)域
國外主要的電信運(yùn)營商,如Verizon、Telefonica、NTT Docomo、法國電信和Orange 、Vodafone 和德國電信等都在2012年啟動了大數(shù)據(jù)相關(guān)項目。目前來看,電信運(yùn)營商運(yùn)用大數(shù)據(jù)有對內(nèi)和對外兩種模式。對內(nèi)主要是為智能管道提供支持,包括基于用戶、業(yè)務(wù)及流量分級的多維管控機(jī)制,以及精準(zhǔn)的客戶分析及自有業(yè)務(wù)的營銷。對外應(yīng)用,一方面是面向公共服務(wù)的大數(shù)據(jù)應(yīng)用,如利用位置和軌跡信息服務(wù)社會,為智慧城市提供海量數(shù)據(jù)預(yù)測服務(wù),包括人口流量模型、城市人口流量等。但電信運(yùn)營商發(fā)展大數(shù)據(jù)應(yīng)用,還面臨著技術(shù)水平、組織架構(gòu)、管理體制等因素制約。
●此外,大數(shù)據(jù)與其他傳統(tǒng)行業(yè)結(jié)合的案例也越來越多
零售巨頭沃爾瑪2014年年初表示,他們在大數(shù)據(jù)上已嘗到了甜頭,例如通過數(shù)據(jù)分析及時指導(dǎo)庫存調(diào)整,將一些店面的業(yè)績提升了40% 。制造業(yè)也在積極擁抱大數(shù)據(jù)。GE公司2013年在全球推廣工業(yè)互聯(lián)網(wǎng)(Industrial Internet),提出要用“傳感器+ 大數(shù)據(jù)”構(gòu)造重塑工業(yè)系統(tǒng),通過數(shù)據(jù)分析進(jìn)一步挖掘工業(yè)生產(chǎn)降耗增效的潛力。GE預(yù)測,到2030年工業(yè)互聯(lián)網(wǎng)將為中國經(jīng)濟(jì)帶來累計3 萬億美元的GDP增量。相對來說,政府和公共部分雖然已經(jīng)積累了大量數(shù)據(jù),但大數(shù)據(jù)應(yīng)用還未找到有效模式。
3、各國推動大數(shù)據(jù)的政策取向和舉措
美、英、日、澳等國家政府高度重視大數(shù)據(jù)產(chǎn)業(yè)發(fā)展,自2012年來密集出臺多項專門政策予以支持。從國外政府的舉措來看,政策著力點主要在于開放數(shù)據(jù)、研發(fā)投入和公共部門應(yīng)用。
美國政府最為迅速和積極,在上述3 方面大力推進(jìn)。美國要求聯(lián)邦政府?dāng)?shù)據(jù)必須實現(xiàn)開放且要采取標(biāo)準(zhǔn)格式供計算機(jī)自動讀取,目前已開放近40萬個數(shù)據(jù)集和上千個工具。在美國倡導(dǎo)下八國集團(tuán)也在2013年發(fā)表數(shù)據(jù)開放憲章,共同推動政府高價值數(shù)據(jù)開放。目前,全球已有60多個國家加入到數(shù)據(jù)開放行列。2012年,美國還率先推出大數(shù)據(jù)行動計劃,全面部署大數(shù)據(jù)關(guān)鍵技術(shù)研發(fā),支持研發(fā)的重點方向是大數(shù)據(jù)基礎(chǔ)關(guān)鍵技術(shù),以及醫(yī)療衛(wèi)生、交通、科研和國土安全等領(lǐng)域的大數(shù)據(jù)應(yīng)用技術(shù)。此外,美國政府也是大數(shù)據(jù)的積極使用者,2013年曝光的棱鏡門事件,揭示了美國國家安全部門大數(shù)據(jù)應(yīng)用范圍之廣、水平之高、規(guī)模之大都遠(yuǎn)遠(yuǎn)超過人們的想象。NSA、FBI 及CIA 等近兩年大量采購亞馬遜和IBM 的云服務(wù),主要也是用來支撐其大數(shù)據(jù)應(yīng)用。
英國、日本、澳大利亞等國也在積極推動大數(shù)據(jù)發(fā)展。英國將大數(shù)據(jù)列為戰(zhàn)略性技術(shù),2013年1 月?lián)芸?.89億用于大數(shù)據(jù)研發(fā),是撥款最多的領(lǐng)域。英國也在積極促進(jìn)政府和共用領(lǐng)域的大數(shù)據(jù)應(yīng)用,2013年5月與李嘉誠基金會宣布聯(lián)合投資設(shè)立全球首個運(yùn)用大數(shù)據(jù)技術(shù)的醫(yī)藥衛(wèi)生科研機(jī)構(gòu)。日本政府認(rèn)為大數(shù)據(jù)是提升日本競爭力的關(guān)鍵,2013年6 月安倍內(nèi)閣的新IT 戰(zhàn)略——“創(chuàng)建最尖端IT 國家宣言”中闡述了2013—2020年期間以發(fā)展開放公共數(shù)據(jù)和大數(shù)據(jù)為核心的日本新IT 國家戰(zhàn)略。2013年8 月初,澳大利亞出臺公共服務(wù)大數(shù)據(jù)政策,提出了大數(shù)據(jù)分析的實踐指南、會碰到的主要障礙以及對數(shù)據(jù)的登錄和使用等,希望通過大數(shù)據(jù)分析系統(tǒng)提升公共服務(wù)質(zhì)量,增加服務(wù)種類,為公共服務(wù)提供更好的政策指導(dǎo)。
4、我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展情況
我國大數(shù)據(jù)發(fā)展已進(jìn)入實際操作階段?;ヂ?lián)網(wǎng)企業(yè)方面,百度、阿里、騰訊三大互聯(lián)網(wǎng)公司的大數(shù)據(jù)處理集群達(dá)到5000臺左右,數(shù)據(jù)存儲規(guī)模達(dá)到200~1000PB,規(guī)模達(dá)到世界先進(jìn)水平;目前,正在打通內(nèi)部數(shù)據(jù)系統(tǒng),構(gòu)建統(tǒng)一的企業(yè)數(shù)據(jù)倉庫,積極應(yīng)用大數(shù)據(jù)改善既有服務(wù),并利用大數(shù)據(jù)資源和技術(shù)開展互聯(lián)網(wǎng)金融等跨界融合業(yè)務(wù)。電信運(yùn)營企業(yè)方面,中國電信提出構(gòu)建數(shù)據(jù)共享服務(wù)體系,開展深度數(shù)據(jù)挖掘,最終將數(shù)據(jù)分析結(jié)果引入到應(yīng)用開發(fā)支撐業(yè)務(wù)發(fā)展;中國移動計劃利用其擁有的海量大數(shù)據(jù)資源,建立數(shù)據(jù)分析平臺,從而實現(xiàn)營銷服務(wù)向“大數(shù)據(jù)、超細(xì)分、微營銷”轉(zhuǎn)型;中國聯(lián)通以移動用戶上網(wǎng)記錄查詢和分析系統(tǒng)為核心整合內(nèi)部資源,發(fā)展定向流量包等創(chuàng)新應(yīng)用。
地方政府積極推動大數(shù)據(jù)發(fā)展,2013年以來陸續(xù)出臺了推進(jìn)計劃。上海計劃3 年內(nèi)選取醫(yī)療衛(wèi)生、食品安全、終身教育、智慧交通、公共安全、科技服務(wù)6 個有基礎(chǔ)的領(lǐng)域,建設(shè)大數(shù)據(jù)公共服務(wù)平臺。天津擬打造國家數(shù)據(jù)聚集區(qū),將建設(shè)1 個占地2.5 萬平方米的大數(shù)據(jù)產(chǎn)業(yè)基地和3 個產(chǎn)業(yè)園區(qū),與北京、河北聯(lián)合建“京津冀大數(shù)據(jù)走廊”。 重慶計劃將大數(shù)據(jù)培育成重要戰(zhàn)略性新興產(chǎn)業(yè),加快建設(shè)兩江云計算產(chǎn)業(yè)園100 萬臺服務(wù)器運(yùn)算能力的數(shù)據(jù)中心集群,并結(jié)合城市特點開展大數(shù)據(jù)示范應(yīng)用。廣東省在剛剛結(jié)束的2014年兩會上分別決定設(shè)立省、市兩級的大數(shù)據(jù)局,專門負(fù)責(zé)推進(jìn)政府部門的信息采集、整理、共享和應(yīng)用,消除信息孤島,在體制創(chuàng)新上開創(chuàng)國內(nèi)先河。此外,陜西西咸新區(qū)、湖北武漢光谷、貴州貴安新區(qū)等地也都紛紛提出要建設(shè)國家級大數(shù)據(jù)基地。但應(yīng)該注意,在地方積極推動大數(shù)據(jù)發(fā)展的同時,也要警惕將大數(shù)據(jù)簡單等同于“大數(shù)據(jù)中心”,大干快上大數(shù)據(jù)園區(qū)的錯誤傾向,避免重蹈“云地產(chǎn)”泡沫覆轍。
5、我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展存在的主要問題
(1)我國數(shù)據(jù)資源儲備不夠豐富,數(shù)據(jù)開放流通程度較低
豐富的數(shù)據(jù)源是大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的前提,而我國信息化發(fā)展水平仍落后于發(fā)達(dá)國家,數(shù)據(jù)資源總量遠(yuǎn)低于美歐,每年新增數(shù)據(jù)量僅為美國的 7% ,歐洲的12% 。與此同時,已有數(shù)據(jù)資源標(biāo)準(zhǔn)化程度低、數(shù)據(jù)質(zhì)量不高、利用價值也大打折扣。此外,在傳統(tǒng)信息化系統(tǒng)建設(shè)模式下,由于對數(shù)據(jù)的重視程度不高,數(shù)據(jù)互通標(biāo)準(zhǔn)缺失,形成眾多“信息孤島”,開放程度低,資源活性差,又進(jìn)一步抑制了數(shù)據(jù)價值的發(fā)揮。如何建立良性發(fā)展的數(shù)據(jù)資源儲備和共享流通的生態(tài)系統(tǒng),是我國大數(shù)據(jù)發(fā)展的首要問題。
(2)我國大數(shù)據(jù)技術(shù)存在水平不高,技術(shù)擴(kuò)散不暢
我國互聯(lián)網(wǎng)企業(yè)快速將國際上先進(jìn)的開源大數(shù)據(jù)技術(shù)整合到自身系統(tǒng)中,并構(gòu)建了較大的系統(tǒng),在國內(nèi)保持領(lǐng)先。但總體上仍缺乏平臺級的原創(chuàng)技術(shù),對國際主流開源社區(qū)的貢獻(xiàn)程度也不高,國內(nèi)產(chǎn)業(yè)界在大數(shù)據(jù)技術(shù)路線發(fā)展中的話語權(quán)微弱。如果這種局面不改變,長遠(yuǎn)看我國產(chǎn)業(yè)界將在大數(shù)據(jù)技術(shù)發(fā)展中越來越被動。
(3)大數(shù)據(jù)對個人信息保護(hù)提出挑戰(zhàn),相關(guān)的法律法規(guī)有待進(jìn)一步完善
大數(shù)據(jù)時代的個人隱私保護(hù)在全球各國都是一個棘手問題。各國現(xiàn)行法律框架對個人隱私的保護(hù),重點是可識別個人身份的信息(PII,Personal Identifiable Information ),包括姓名、出生日期、身份證件號碼、住址、電話號碼、賬號和密碼等能夠單獨或者與其他信息結(jié)合識別用戶的信息。只要保護(hù)好這些個人信息(PII)就能很好保護(hù)隱私,為此法律通常規(guī)定收集個人信息遵循知情同意原則。但大數(shù)據(jù)的應(yīng)用很難在收集環(huán)節(jié)將后續(xù)利用一一告知用戶。但如果按現(xiàn)行法律框架,將制約個人數(shù)據(jù)價值的發(fā)揮,立法司法面臨進(jìn)退兩難局面。大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展,必須解決好個人隱私保護(hù),還要保護(hù)好數(shù)據(jù)安全、知識產(chǎn)權(quán),這就要求有一套完善健全的法律法規(guī)體系,我國這方面還有很多工作要做。
6、推動我國大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的政策思考
結(jié)合國際經(jīng)驗與我國面臨的實際問題,我國政府推動大數(shù)據(jù)的發(fā)展,需要首先明確我國大數(shù)據(jù)發(fā)展的戰(zhàn)略目標(biāo)和戰(zhàn)略重點,統(tǒng)籌謀劃大數(shù)據(jù)應(yīng)用、關(guān)鍵技術(shù)研發(fā)和擴(kuò)散、產(chǎn)業(yè)培育、數(shù)據(jù)開放與數(shù)據(jù)保護(hù)、市場監(jiān)管、法律法規(guī)等關(guān)鍵布局,從大數(shù)據(jù)應(yīng)用效果顯著的社會公共服務(wù)和互聯(lián)網(wǎng)商業(yè)應(yīng)用入手開展大數(shù)據(jù)試點,引導(dǎo)地方大數(shù)據(jù)發(fā)展方向,避免再次形成“數(shù)據(jù)中心”的虛熱。
(1)在技術(shù)創(chuàng)新上,建議改革支持方式,加快大數(shù)據(jù)共性和前瞻技術(shù)研發(fā)
首先,要加強(qiáng)大數(shù)據(jù)技術(shù)創(chuàng)新支持方向的前瞻性和系統(tǒng)性,近期重點支持深度學(xué)習(xí)與人工智能、實時大數(shù)據(jù)處理、海量數(shù)據(jù)存儲管理、交互式數(shù)據(jù)可視化和應(yīng)用相關(guān)的分析技術(shù),探索由國內(nèi)產(chǎn)業(yè)力量打造自主開源大數(shù)據(jù)平臺軟件的可行性。同時,還要順應(yīng)互聯(lián)網(wǎng)創(chuàng)新特點,創(chuàng)新科研項目支持方式,把握大數(shù)據(jù)技術(shù)開放創(chuàng)新的特點,在科研與產(chǎn)業(yè)化項目中將開源和開放標(biāo)準(zhǔn)作為考核指標(biāo),通過直接補(bǔ)助或后補(bǔ)助方式激勵企業(yè)和科研機(jī)構(gòu)參與開源發(fā)展,促進(jìn)大數(shù)據(jù)技術(shù)擴(kuò)散。
(2)在政府?dāng)?shù)據(jù)開放上,建議完善配套制度,分類分批推動政府?dāng)?shù)據(jù)開放
首先,要推進(jìn)政府和公用事業(yè)領(lǐng)域數(shù)據(jù)資源的普查工作,界定數(shù)據(jù)權(quán)屬,理順利益機(jī)制。同時,按照相關(guān)法規(guī)制定政府和公共數(shù)據(jù)開放中的安全和隱私保護(hù)檢查表,對可能涉及國家安全和公民隱私的風(fēng)險點進(jìn)行嚴(yán)格控制。在此基礎(chǔ)上,按敏感性對政府和公共數(shù)據(jù)進(jìn)行分類,確定開放優(yōu)先級,制定分步驟的數(shù)據(jù)開放路線圖。
(3)在個人數(shù)據(jù)保護(hù)上,建議結(jié)合國際立法理念的演變趨勢,對我國相關(guān)制度的調(diào)整進(jìn)行前期研究。同時,為了解決當(dāng)前數(shù)據(jù)保護(hù)的緊迫需求,可行的途徑是通過行業(yè)組織,及時總結(jié)業(yè)界的最佳實踐,逐步形成行業(yè)共識,在試點成熟后上升為標(biāo)準(zhǔn)或法律法規(guī),并通過行業(yè)自律和政府引導(dǎo)相結(jié)合的機(jī)制進(jìn)行推廣。
(審核編輯: 智匯胡妮)
分享