人工智能技術(shù)的發(fā)展,給垂直產(chǎn)業(yè)帶來巨大變革,以醫(yī)療、無人車、安防、金融等垂直行業(yè)的變化最受到關(guān)注,多位知名投資人都強(qiáng)調(diào)現(xiàn)在真正能落地的就是AI在垂直行業(yè)的應(yīng)用,可謂“不垂直,不快樂”。但是AI雖火,人的價(jià)值中存在批判性思維:醫(yī)療AI最有前途的技術(shù)是否是深度學(xué)習(xí)?是什么樣的技術(shù)要診斷22542個(gè)ICD10疾病?誰能成就醫(yī)學(xué)界的ImageNet?
新智元于3月25日參加智慧未來·醫(yī)療人工智能峰會(huì),活動(dòng)由匯醫(yī)慧影、英特爾醫(yī)療等聯(lián)合主辦。其中匯醫(yī)慧影成立于2015年,其創(chuàng)始人柴象飛兩年前從斯坦福大學(xué)回到國內(nèi),那時(shí)候他覺得春雨醫(yī)生做的非常好,讓他看到了醫(yī)療影像在商業(yè)模式上的巨大創(chuàng)新。因此他和郭娜一起創(chuàng)立了匯醫(yī)慧影,致力于發(fā)掘醫(yī)療影像數(shù)據(jù)價(jià)值,以最前沿的云計(jì)算、大數(shù)據(jù)和人工智能技術(shù),打造智能醫(yī)學(xué)影像平臺(tái)和腫瘤放療平臺(tái)。在這一過程中,英特爾醫(yī)療提供了很多支持,匯醫(yī)慧影也成為了英特爾聯(lián)合實(shí)驗(yàn)室的一員。
參與本次醫(yī)療AI峰會(huì)的嘉賓有英特爾醫(yī)療與生命科學(xué)部亞太區(qū)總經(jīng)理李亞東,匯醫(yī)慧影創(chuàng)始人柴象飛和郭娜,藍(lán)馳創(chuàng)投合伙人陳維廣,斯坦福大學(xué)放療科終身教授邢磊,跨入到醫(yī)療界的國際核能院院士張勤,萬方數(shù)據(jù)股份有限公司副總經(jīng)理張秀梅,鄭大五附院黨委書記王新軍和某著名設(shè)備商代表。本文綜合了會(huì)場演講、論壇和新智元對斯坦福醫(yī)療AI專家邢磊的專訪內(nèi)容,讓我們破除迷信,跟隨AI技術(shù)大牛和醫(yī)療行業(yè)大拿一起揭開中國醫(yī)療AI之現(xiàn)狀。
強(qiáng)化深度學(xué)習(xí):醫(yī)療AI最有前途的技術(shù)?
自從2012年深度學(xué)習(xí)技術(shù)被引入到圖像識(shí)別數(shù)據(jù)集ImageNet(做為測試標(biāo)準(zhǔn)),其識(shí)別率近年屢創(chuàng)新高,并且在某些領(lǐng)域如圖像分類等方面達(dá)到人類水平。深度學(xué)習(xí)技術(shù)加上醫(yī)療影像領(lǐng)域累積多年的數(shù)據(jù),給這一領(lǐng)域帶來了令人驚喜的突破。
新智元曾經(jīng)報(bào)道過斯坦福的研究人員發(fā)布在Nature上的研究,CNN做皮膚癌診斷,與21位皮膚科醫(yī)生對比測試,結(jié)果系統(tǒng)的精確度與人類醫(yī)生相當(dāng)(“至少”91%)。還有JAMA上發(fā)布的利用CNN對糖尿病視網(wǎng)膜病變的診斷,結(jié)果表明,其算法的性能與眼科醫(yī)生的性能一致。
CNN在醫(yī)學(xué)上的應(yīng)用可謂在頂級刊物上連放大招,那么深度學(xué)習(xí)技術(shù)是醫(yī)學(xué)影像領(lǐng)域效果最好的技術(shù)嗎?
斯坦福大學(xué)邢磊教授告訴新智元:深度學(xué)習(xí)及強(qiáng)化深度學(xué)習(xí),代表目前新潮的技術(shù),它們能解決很多以前不能解決的問題,把醫(yī)療AI推向新的高潮。
深度學(xué)習(xí)
強(qiáng)化深度學(xué)習(xí)在2016年初AlphaGo對戰(zhàn)李世乭中大放異彩。AlphaGo學(xué)習(xí)棋譜到了一定程度,就可在和對手及自己對弈的大量棋局中,使用強(qiáng)化學(xué)習(xí)來進(jìn)一步改善它,這可以說是它不斷超越自己,最終戰(zhàn)勝人類冠軍的關(guān)鍵所在。作為一種有效的機(jī)器學(xué)習(xí)方法,強(qiáng)化學(xué)習(xí)主要研究在特定情境或環(huán)境下的操作方式,使得獎(jiǎng)勵(lì)信號最大化。同樣在醫(yī)療AI的決策過程中,一個(gè)程序操作會(huì)常會(huì)影響其接收到的數(shù)據(jù),不同的操作中程序會(huì)接受到不同的輸入信息。強(qiáng)化學(xué)習(xí)可找出決策或操作的最優(yōu)方案,以獲得最大的獎(jiǎng)勵(lì)。
乳腺鉬靶腫塊判讀
邢磊博士介紹,其實(shí)在深度學(xué)習(xí)之前,大約在90年代,就已有很多人做計(jì)算機(jī)輔助診斷(CAD)。之前神經(jīng)網(wǎng)絡(luò)做不深,現(xiàn)在有了新型計(jì)算機(jī)和深度學(xué)習(xí)之后,可以實(shí)現(xiàn)很深的網(wǎng)絡(luò)。但是就以皮膚癌的診斷為例,目前在臨床上還沒有真正意義上的大規(guī)模的應(yīng)用?;谏疃葘W(xué)習(xí)的診斷尚處于研發(fā)階段。但以現(xiàn)在的研發(fā)速度來看,這些新技術(shù)離臨床應(yīng)用已經(jīng)并不十分遙遠(yuǎn)了。
腦出血區(qū)域自動(dòng)標(biāo)記
另外,深度學(xué)習(xí)并不是在所有場景下都需要。這跟具體遇到的問題有關(guān),有時(shí)候一般的機(jī)器學(xué)習(xí)技術(shù)已經(jīng)夠用。新的算法可以說是層出不窮,日新月異。把不同的算法結(jié)合起來也是AI的領(lǐng)域常用的方法。
動(dòng)態(tài)不確定因果圖:診斷各種疾病
人工智能不止是深度學(xué)習(xí),也不止是大數(shù)據(jù),張勤教授深以為然。他通過多年研究,提出了一套動(dòng)態(tài)不確定因果圖DUCG(DynamicUncertain Causality Graph)理論,用于因果知識(shí)的圖形表達(dá)和推理。DUCG克服了貝葉斯網(wǎng)絡(luò)的簡潔表達(dá)和推理模型只適用于單賦值情況,不適用于多賦值和邏輯循環(huán)等情況的問題。
張勤教授創(chuàng)立動(dòng)態(tài)不確定因果圖的本意是為了解決核電站的在線故障診斷,因?yàn)楹穗姽收蠑?shù)據(jù)極少,診斷要求高(要診斷從未出現(xiàn)過的故障),必須充分利用領(lǐng)域?qū)<抑R(shí)才行。核電站有數(shù)千甚至數(shù)萬個(gè)實(shí)時(shí)動(dòng)態(tài)信號,故障發(fā)展迅速,要求DUCG能夠在秒級對眾多信號(其中可能存在虛假信號)進(jìn)行動(dòng)態(tài)推理,高效準(zhǔn)確地診斷故障,為提升核電站的安全性和經(jīng)濟(jì)效益提供智能技術(shù)支持。他的團(tuán)隊(duì)迄今已取得上百起故障診斷實(shí)驗(yàn)100%的成功率,無一失手。現(xiàn)已用于核電站和衛(wèi)星系統(tǒng)的故障監(jiān)測和診斷。
那么DUCG能否用于醫(yī)療診斷呢?
張勤團(tuán)隊(duì)首先與醫(yī)學(xué)專家合作,針對各類疾病建立DUCG醫(yī)學(xué)知識(shí)庫(并不是機(jī)器從數(shù)據(jù)里面自動(dòng)學(xué)出知識(shí),而是醫(yī)生用圖形語言在機(jī)器中表達(dá)自己的知識(shí),并由機(jī)器自動(dòng)合成知識(shí)庫。)張勤認(rèn)為,宏觀世界(微米以上尺度)萬物皆因果,例如上呼吸道感染可能導(dǎo)致咳嗽、頭痛等,這就是具有不確定性的因果知識(shí)。他們用103張因果子圖合成一個(gè)知識(shí)庫,包含各種風(fēng)險(xiǎn)因素、病史、癥狀、體征、影像學(xué)檢查和實(shí)驗(yàn)室檢查、以及各種邏輯組合和無條件或有條件因果關(guān)系及不確定性參數(shù),與DUCG推理機(jī)相結(jié)合,進(jìn)行疾病診斷。
他們這套系統(tǒng)跟某醫(yī)院合作診斷某類疾病,樣本集中有近4000個(gè)病例,涉及27種病,按照每種病不超過10個(gè)病例隨機(jī)抽出203個(gè)病例進(jìn)行測試,最后結(jié)果正確率99.01%,只有兩個(gè)病例因記錄不完整而不正確。張勤的團(tuán)隊(duì)還做過眩暈疾病的DUCG診斷,也達(dá)到了遠(yuǎn)高于國際同行的正確率。目前正在開展暈厥和胸痛疾病的智能診斷知識(shí)庫開發(fā)。
張勤團(tuán)隊(duì)正在進(jìn)一步開發(fā)這套系統(tǒng)使之不僅能幫助醫(yī)生診斷,而且能啟發(fā)醫(yī)生知道下一步做什么檢查最有價(jià)值,而不是盲目檢查,增加醫(yī)保和病人的負(fù)擔(dān)。這套系統(tǒng)還可用于醫(yī)院分診,也就是根據(jù)病人自述和分診師了解到的信息計(jì)算并排序選擇優(yōu)先就診的科室或可能需要的會(huì)診科室。
張勤還表示,重要的是智能診斷系統(tǒng)不僅能告訴病人或醫(yī)生是什么病,還要告訴為什么是這個(gè)病,因?yàn)樽鰶Q策并承擔(dān)責(zé)任的是醫(yī)生,不是智能系統(tǒng),至少在目前的情況下是如此。最后他認(rèn)為,醫(yī)療數(shù)據(jù)并不是只要多就好,數(shù)據(jù)質(zhì)量高才行。
下一個(gè)挑戰(zhàn):誰能成就醫(yī)學(xué)界的ImageNet?
醫(yī)療AI的技術(shù)遠(yuǎn)不止深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、動(dòng)態(tài)不確定圖等,此外醫(yī)療AI中也面臨著很多挑戰(zhàn)。
全維度數(shù)據(jù):基因 + 蛋白 + 病理+ 影像 + 臨床 + 隨訪
對于普通的圖像研究者,ImageNet提供了1000萬張意義上的圖片供訓(xùn)練。但是醫(yī)學(xué)數(shù)據(jù)非常大,對于醫(yī)學(xué)影像診斷的模型,目前并沒有一個(gè)權(quán)威的公開數(shù)據(jù)集。根據(jù)斯坦福邢磊博士所說,數(shù)據(jù)庫也是有一些,但是并不全,并不足夠大。比如乳腺癌有數(shù)據(jù)集算比較多的,但是沒有大到幾十萬個(gè)病例。研究人員有時(shí)候需要自己采集數(shù)據(jù),很多時(shí)候可能就只有用幾百個(gè)數(shù)據(jù)來訓(xùn)練模型。
邢磊博士也提出,很難確定多大的數(shù)據(jù)是大數(shù)據(jù),畢竟數(shù)據(jù)量并不是越大越好,有時(shí)候可能有限的病人數(shù)據(jù)就足夠了,這與具體情況和問題及數(shù)據(jù)的質(zhì)量有關(guān)。
但是如果有一個(gè)權(quán)威大數(shù)據(jù)集,對研究者來說絕對是一件好事。但是這是一種階梯式發(fā)展的,無法一蹴而就。跟ImageNet不同,一個(gè)權(quán)威巨型的醫(yī)學(xué)數(shù)據(jù)集可能最先在中國實(shí)現(xiàn)而不是外國。因?yàn)檎畢⑴c力度可以較大。一般的講,病人數(shù)據(jù)及數(shù)據(jù)的使用涉及病人隱私及權(quán)利。雖然大家都知道這個(gè)數(shù)據(jù)集對病人、醫(yī)院,已及整個(gè)人類社會(huì)都有利,但是這件事情需要政府層面的政策和統(tǒng)籌協(xié)調(diào)。
邢磊教授樂觀的表示,這件事情是遲早會(huì)解決,且中國的優(yōu)勢可能更大。
那么正如張勤提到的需要對2萬多種疾病診斷,如果每一個(gè)都做人工智能,也是一個(gè)很大的工程,應(yīng)該怎么解決?
邢磊博士表示,將來需要一個(gè)醫(yī)學(xué)界的平臺(tái),就像谷歌的Tensorflow,但是比Tensorflow更上層,專注于影像。疾病雖然多,但是還是有許多共同之處,并不是每一個(gè)AI模型都需從頭做起。人們甚至可以考慮把目前已做不了醫(yī)學(xué)影像的Tensorflow添加影像處理的功能,再將這種平臺(tái)開放,然后再細(xì)化到具體的各個(gè)病種。這當(dāng)然還是要依靠醫(yī)學(xué)界不同領(lǐng)域的同仁來共同努力和貢獻(xiàn)。
兩大趨勢兩大不平衡,竟讓中國成為醫(yī)療AI最佳落地點(diǎn)
英特爾醫(yī)療李亞東介紹了全球的兩大趨勢成為醫(yī)療AI 的巨大驅(qū)動(dòng)力:
1. 人口老齡化,特別是中國,中國2020年將達(dá)到20%65歲以上老齡化人口。55歲以上的人群占用的醫(yī)療資源在50%以上。在這樣的人口老齡化的背景對人工智能的需求急劇上升。怎么樣解決這樣一個(gè)急需增長的需求的挑戰(zhàn)?
2. 慢性病的挑戰(zhàn)接踵而至。中國是慢性病問題最嚴(yán)重的一個(gè)區(qū)域,中國的患病人口在全球毫無疑問是領(lǐng)先的。
可以說,這兩大趨勢使得中國或成為醫(yī)療AI最大市場。
兩大不平衡:
第一是醫(yī)療資源供需嚴(yán)重不平衡。不僅僅在中國,在美國也嚴(yán)重不足,美國去年缺30幾萬護(hù)士,十幾萬醫(yī)生。中國醫(yī)患關(guān)系緊張,工作壓力大,醫(yī)學(xué)院畢業(yè)生在三年之內(nèi)50%以上轉(zhuǎn)行做其他行業(yè)。好醫(yī)生尤其稀缺,中國的三甲醫(yī)院人滿為患。怎么樣解決這些問題?
第二是地域醫(yī)療資源不平衡。2013年三甲醫(yī)院占衛(wèi)計(jì)委醫(yī)療總數(shù)的0.1%,但是大量的病人是在基層,而極少數(shù)的三甲醫(yī)院門庭若市,醫(yī)生連上廁所的時(shí)間都沒有。大城市的三甲醫(yī)院跟鄉(xiāng)村或小城市醫(yī)療實(shí)力天壤之別,即使有的地方醫(yī)院設(shè)備很先進(jìn),但是醫(yī)務(wù)人員軟實(shí)力欠缺,拿著好設(shè)備看病看不準(zhǔn)。對于三四線城市甚至偏遠(yuǎn)山區(qū)的人,怎么讓他們也能享受到較高質(zhì)量的醫(yī)療服務(wù)?
總之,在老齡化和慢性病的大環(huán)境下,醫(yī)療資源(人、物)供應(yīng)短缺,特別是中國醫(yī)療資源供需嚴(yán)重不平衡,地域資源差距巨大,人工智能可能是解決這些問題的突破口。
未來:醫(yī)療AI解放了誰?
《人類簡史》的作者在書中預(yù)言,大數(shù)據(jù)和人工智能的發(fā)展成熟,會(huì)讓6成的人類失去工作。目前,醫(yī)療中一些領(lǐng)域AI已經(jīng)達(dá)到人類水平了,是否會(huì)引起大批醫(yī)療工作者的失業(yè)?這些醫(yī)療工作者如何適應(yīng)這一變革?
邢磊博士表示,這是一個(gè)漸進(jìn)的過程,并不會(huì)突然發(fā)生,可能需要10年、15年。對于可能被取代的人,焦慮無法避免,每一次技術(shù)革命都會(huì)有類似的焦慮。這是一個(gè)適應(yīng)過程,時(shí)間拉得越長,適應(yīng)過程來的會(huì)越簡單 。目前,大部分醫(yī)療的工作還是勞動(dòng)密集型,工作量很大,知識(shí)訓(xùn)練要求很高,這些以后會(huì)有很大的改善。
但是,AI不會(huì)也不可能代替醫(yī)生,即使機(jī)器在某方面比人強(qiáng),但計(jì)算機(jī)畢竟是計(jì)算機(jī),它的“思維”是人類訓(xùn)練出來的,無論是廣度和深度都將是有限的。還是有特例,最后還是需要人做決定。 邢磊博士說:“我希望還是由人來做決定,是在機(jī)器輔助下的人的決定,而不是機(jī)器讓我吃什么藥,打什么針,這不人性化?!彼J(rèn)為機(jī)器與人的合作更好,機(jī)器沒有創(chuàng)新,但是人會(huì)有創(chuàng)新。機(jī)械式的非精準(zhǔn)醫(yī)療會(huì)漸漸消失,這是大趨勢,但是把所有醫(yī)療工作完全交給機(jī)器是不太可能的,至少還有很漫長的路要走。
最后借用自稱“人工智能人文學(xué)派支持者”張秀梅的話結(jié)束: “醫(yī)生是醫(yī)者仁心,不管人工智能技術(shù)再怎么發(fā)展,好醫(yī)生永遠(yuǎn)都是不可替代的。資本和技術(shù)本身是沒有屬性的,可善可惡。但是到了醫(yī)療健康的產(chǎn)業(yè)資本的時(shí)候,我們要正確的三觀,要把所做的事情引向治病救人的善念?!?/p>
“我們不是考慮AI是否取代醫(yī)生,我們應(yīng)該考慮的是怎么讓AI真正幫助到人。”向每一個(gè)醫(yī)療行業(yè)用AI改善醫(yī)療服務(wù)的人致敬!
(審核編輯: 林靜)