用表格存儲玩轉(zhuǎn)車聯(lián)網(wǎng)數(shù)據(jù)
點擊:1124
A+ A-
所屬頻道:新聞中心
“自動駕駛汽車”在近兩年頻頻出現(xiàn)于各大科技新聞頭條,自2012年谷歌獲得美國首個自動駕駛汽車許可證以來,國外各大知名汽車廠商如奔馳、沃爾沃、大眾、通用、豐田、日產(chǎn)、特斯拉等也紛紛宣布自己的自動駕駛汽車驗證開發(fā)計劃。自動駕駛依托于人工智能技術(shù)的發(fā)展,而對于一個人工智能平臺來說,重要的不光是算法和平臺,更重要的是數(shù)據(jù)!今天我們暫且不聊自動駕駛,我們先聊聊最基礎(chǔ)的車聯(lián)網(wǎng)數(shù)據(jù)的存儲與處理。
出于對兩客一危監(jiān)管的需要,車聯(lián)網(wǎng)很早就開始起步,彼時大家的車聯(lián)網(wǎng)方案都長這個樣子:
將車輛上傳的數(shù)據(jù)進行編碼解析,存儲到對應(yīng)的數(shù)據(jù)庫中。由于車輛種類的不同,所上傳的傳感器數(shù)據(jù)也會有所區(qū)別。為了避免修改表結(jié)構(gòu)對服務(wù)造成的影響,采用的是將傳感器數(shù)據(jù)進行分類,分別存儲到不同的數(shù)據(jù)庫的方法,也就是圖中的數(shù)據(jù)庫層分為了軌跡庫、溫度庫、 油量庫等。這樣的好處是新增一批新類型的傳感器時,不需要數(shù)據(jù)停庫維護,不會影響在線應(yīng)用,但是對數(shù)據(jù)采集解析程序需要升級更新,大大增加了維護的代價。
另外一方面,隨著近幾年私家車的爆發(fā)式增長,車聯(lián)網(wǎng)也迎來了更多的機遇和挑戰(zhàn)。百萬在網(wǎng)車輛,幾十萬的在線車輛都讓車聯(lián)網(wǎng)系統(tǒng)時時刻刻在經(jīng)受著挑戰(zhàn)。
首先就是并發(fā)問題。SQLServer的單機并發(fā)是有限制的,我們只能在已經(jīng)分庫分表的基礎(chǔ)上再對數(shù)據(jù)進行按時間或者車輛類型的二次分庫分表,這大大增加了前后端系統(tǒng)開發(fā)和維護的復(fù)雜性。同時,為了應(yīng)對早晚高峰高的不像話的在線率,我們又對像軌跡、油量等通用的基礎(chǔ)數(shù)據(jù)做了數(shù)據(jù)庫的主備讀寫分離,避免數(shù)據(jù)采集高峰影響其他的在線業(yè)務(wù),這個時候,這個架構(gòu)已經(jīng)非常非常復(fù)雜了。
不僅僅是在線業(yè)務(wù),由于多層次的分庫分表,我們的報表分析程序中跨表跨庫的Join查詢讓經(jīng)驗豐富的DBA也頭疼痛不已。
而為了保持在這個行業(yè)的競爭力,降低成本是非常有效的一個法寶。我們采用的最直接的手段就是在夜深人靜的時候 小心翼翼 的刪除掉過期的數(shù)據(jù)。
新的方案,刻不容緩!
我們開始尋找基于云計算的分布式數(shù)據(jù)解決方案,直到我們看到了下面的一張圖。
表格存儲(OTS)是阿里云最近推出的一款自研分布式 NoSQL 數(shù)據(jù)庫,其schema free的特性很適合屬性列變化較為頻繁的數(shù)據(jù)存儲。車載設(shè)備更新和迭代的速度也在不斷加快,車聯(lián)網(wǎng)的業(yè)務(wù)模式也在不斷在變化,表格存儲這種弱結(jié)構(gòu)的數(shù)據(jù)模式與當(dāng)前車聯(lián)網(wǎng)數(shù)據(jù)的需求非常契合。所有車輛的數(shù)據(jù)均可以存儲在一張大表里,新的車載設(shè)備上線也不需要修改表結(jié)構(gòu)了。
于是,我們將原來的方案替換成:
經(jīng)過測試,百萬車輛50%的在線率的時候,讀寫的性能都沒有出現(xiàn)明顯的變化,而且表格存儲是一款全托管的服務(wù),也大大減輕了我們運維上的代價。
表格存儲的數(shù)據(jù)生命周期功能可謂是數(shù)據(jù)管理的神器,我們將不同數(shù)據(jù)存儲時長要求的數(shù)據(jù)存儲在一張大表中,設(shè)置好過期時間,過期的數(shù)據(jù)會自動被刪除掉,不僅僅很方便的控制了成本,更降低了人工操作的風(fēng)險。
對于報表分析,我們將原來在SQLServer上的SQL分析語句遷移到了MaxCompute(就是阿里云以前的ODPS) 上,在MaxCompute上關(guān)聯(lián)好TableStore上的外表,定期執(zhí)行,既方便,又省錢。這一樣以來無需維護數(shù)據(jù)分析程序,并且按量付費的模式可以最大限度節(jié)省成本。
粗略算了下,使用表格存儲的成本,一輛車不停的跑一年,存儲與讀寫分析的成本也只有1塊5,比買瓶飲料還便宜,比最初使用的方案中單車年成本低了一個數(shù)量級。
寫在最后
選擇上云是我們一個非常大的挑戰(zhàn),一度擔(dān)心云上的穩(wěn)定性會導(dǎo)致我們業(yè)務(wù)的失靈,然而事實證明我們的選擇是正確的,云確確實實帶來了很多便利,節(jié)省了很多成本,讓我們可以更聚焦在業(yè)務(wù)邏輯上,技術(shù)架構(gòu)也能快速迭代,為我們保持一定的行業(yè)競爭力提供了有力保障。
(審核編輯: 林靜)
分享