許多人有所不知,國(guó)內(nèi)現(xiàn)有的信息化系統(tǒng)已經(jīng)超過(guò)4000個(gè),平均每家醫(yī)院使用的超過(guò)100個(gè),這些系統(tǒng)對(duì)數(shù)據(jù)的結(jié)構(gòu)和表達(dá)存在很大差異,這其中有超過(guò)半數(shù)數(shù)據(jù)是自然語(yǔ)言的文本,而每家醫(yī)院的科室甚至醫(yī)生對(duì)信息的書寫方式都可能不同,這種極度復(fù)雜性讓計(jì)算機(jī)無(wú)法理解數(shù)據(jù)且進(jìn)行計(jì)算。
如果換成人工執(zhí)行,500人終其一生也無(wú)法處理數(shù)十億的病歷。
但是有這么一家公司,確實(shí)做到了。經(jīng)過(guò)4年的不懈努力、8億元的巨額投入, 500位科學(xué)家的執(zhí)著,縱深大量疾病研究,“在泥濘中砥礪前行,打造未來(lái)數(shù)字醫(yī)療的基礎(chǔ)設(shè)施”,最終獲得了近百家中國(guó)頂級(jí)醫(yī)療研究機(jī)構(gòu)(排名前150)和政府機(jī)構(gòu)的信任。這家公司就是醫(yī)渡云。
“20 人、8 億元、12 億份、2000 萬(wàn)個(gè)”
2013年,醫(yī)渡云成立了一支20人的團(tuán)隊(duì)。他們憑著一股“以可用數(shù)據(jù)作為基礎(chǔ)的新型醫(yī)療才是未來(lái)”的信念,花了近4年時(shí)間、8 億資金只做一件事:埋首于醫(yī)療大數(shù)據(jù)、人工智能基礎(chǔ)平臺(tái)研發(fā)。
至今,他們協(xié)助醫(yī)療機(jī)構(gòu)完成超過(guò)12億余份病歷資料的數(shù)字化與數(shù)據(jù)化處理,從中建立超過(guò)2000多萬(wàn)個(gè)診斷名的標(biāo)準(zhǔn)化,這意味著每天的病歷處理數(shù)量高達(dá)70萬(wàn)份、每天至少需建立超過(guò)1.5萬(wàn)個(gè)標(biāo)準(zhǔn)化診斷名。國(guó)內(nèi)排名前 150 家醫(yī)院中三分之二是它的合作客戶。今年,他們還將與10個(gè)省市政府機(jī)構(gòu),合作建立起區(qū)域化醫(yī)療數(shù)據(jù)平臺(tái)。
“20 人、8 億元、12億筆、2000萬(wàn)個(gè)”,這些數(shù)字,代表著一家中國(guó)原創(chuàng)公司的崛起。或許這些數(shù)字在大多數(shù)人眼中并不特別,但正是這些數(shù)字背后的力量在推動(dòng)中國(guó)醫(yī)療改革,用數(shù)據(jù)人工智能改善民生。
醫(yī)渡云正在改變中國(guó)醫(yī)療行業(yè)的樣貌。
這一波人工智能的復(fù)興,在中國(guó)出現(xiàn)了許多贏得巨額融資的初創(chuàng)公司,沒(méi)有鎂光燈照射的醫(yī)渡云在公眾界顯得有點(diǎn)“默默無(wú)名”。盡管獲得大型投資機(jī)構(gòu)投資,從技術(shù)開發(fā)、落地、到串起產(chǎn)學(xué)研三大環(huán)節(jié),早已超過(guò)獨(dú)角獸的身價(jià),但他們從未對(duì)外公布。
而且,他們所做事情的起點(diǎn),實(shí)際上也是整個(gè)醫(yī)療過(guò)程中相當(dāng)辛苦的部分——把原始數(shù)據(jù)變成可用數(shù)據(jù),即“大數(shù)據(jù)的基礎(chǔ)處理”。
“醫(yī)療這件事,大家都想做,比如說(shuō)掛號(hào)、幫你找專家等,我不否認(rèn)他們的價(jià)值,但最最基礎(chǔ)的工作,把原始數(shù)據(jù)變成可用數(shù)據(jù)這種‘臟活’,沒(méi)人愿意做”醫(yī)渡云創(chuàng)始人宮如璟開玩笑的說(shuō)。但事實(shí)的確如此,建立基礎(chǔ)的活最難做,就像蓋房子打地基一樣,因此很少有初創(chuàng)公司會(huì)像醫(yī)渡云一樣選擇切入技術(shù)門檻很高的基礎(chǔ)系統(tǒng)。
他們?yōu)橹袊?guó)醫(yī)療體系打“地基”的進(jìn)展如何呢?醫(yī)渡云處理病歷數(shù)累計(jì)12億余份,整理出2000多萬(wàn)個(gè)診斷名。能把分散的、非結(jié)構(gòu)、非標(biāo)準(zhǔn)化的數(shù)據(jù)自動(dòng)轉(zhuǎn)化成標(biāo)準(zhǔn)可用的,而且聚集起來(lái),這就是醫(yī)渡云的技術(shù)本事。
有了這個(gè)一致化的數(shù)據(jù)集后,基礎(chǔ)架構(gòu)平臺(tái)可以發(fā)揮效用的空間就被徹底打開了。
敢啃“硬骨頭”,才能構(gòu)建起龐大規(guī)模平臺(tái)
在諸多公司里,大多數(shù)是選定一、兩個(gè)領(lǐng)域切入,鮮少看到一家公司像醫(yī)渡云一樣,戰(zhàn)線拉得這么遠(yuǎn):開發(fā)的“醫(yī)學(xué)數(shù)據(jù)智能平臺(tái)”(DPAP)涵蓋從基礎(chǔ)科研、臨床系統(tǒng)、醫(yī)院管理系統(tǒng),再到跨院跨區(qū)的合作共享,但卻又能全盤統(tǒng)籌、協(xié)作有秩,而非“PPT造車”式的紙上談兵。
在數(shù)據(jù)領(lǐng)域產(chǎn)生質(zhì)的突破,才能解密整個(gè)產(chǎn)業(yè)鏈。這也是產(chǎn)業(yè)鏈中最“硬“的骨頭。原因除了重視隱私保護(hù)的行業(yè)特性,使得對(duì)科技的評(píng)估、導(dǎo)入相對(duì)較慢之外,很多數(shù)據(jù)是屬于非結(jié)構(gòu)化甚至醫(yī)生個(gè)性化的自然語(yǔ)言文本,例如醫(yī)生主觀撰寫的病歷、巡診紀(jì)錄,而且信息散落院內(nèi)各部門,也導(dǎo)致了數(shù)據(jù)運(yùn)用之難。
要突破這個(gè)瓶頸,第一件事就是得有一個(gè)基礎(chǔ)設(shè)施平臺(tái),接著再讓平臺(tái)上長(zhǎng)出各種智能模塊,并且能與醫(yī)院現(xiàn)有的系統(tǒng)對(duì)接。
因此,醫(yī)渡云用三年半的時(shí)間專注開發(fā)出一個(gè)整合性極強(qiáng)的醫(yī)療數(shù)據(jù)處理系統(tǒng),能把原始零散的不可計(jì)算數(shù)據(jù)變成高質(zhì)量可計(jì)算可應(yīng)用數(shù)據(jù),平臺(tái)上聚集了大量知識(shí)圖譜、 300 種以上的智能處理模塊以及二十余種專病庫(kù)。
這件事有多難?醫(yī)渡云首席技術(shù)官(CTO)徐濟(jì)銘舉了一個(gè)具體的例子,同一個(gè)疾病,每位醫(yī)生的寫法可能都不同,例如“二型糖尿病”的”二”,有人寫漢字、阿拉伯?dāng)?shù)字等,還有人會(huì)寫糖尿病二型、或是 Type 2 Diabetes ,這還只是最簡(jiǎn)單的一種,很多拗口的疾病有更多復(fù)雜的寫法,盡管在醫(yī)療診斷里有所謂的國(guó)際疾病分類編碼標(biāo)準(zhǔn)(ICD),不過(guò)也才 2 萬(wàn)多種,不足以應(yīng)付實(shí)際情形的發(fā)展。
想要解決這個(gè)問(wèn)題,就必須讓機(jī)器看懂不同說(shuō)法其實(shí)都是指同一種疾病。而這個(gè)問(wèn)題還只是DPAP平臺(tái)上數(shù)不清的問(wèn)題中的一個(gè)“小”問(wèn)題,解決它都需要計(jì)算機(jī)對(duì)自然語(yǔ)言中詞語(yǔ)的結(jié)構(gòu)和語(yǔ)義有深刻的理解才能做得到。
而醫(yī)渡云開發(fā)的基礎(chǔ)平臺(tái)可以把過(guò)去分散的、來(lái)自不同廠商的數(shù)據(jù)等,快速轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)化,而且符合 CFDA 和美國(guó)食品藥物監(jiān)督管理局(FDA)認(rèn)可的數(shù)據(jù)。
300個(gè)模塊功能背后的超長(zhǎng)戰(zhàn)線
醫(yī)渡云的四位創(chuàng)始人不斷提及的一個(gè)理念就是:“改善人類與疾病的關(guān)系”,但具體要如何”改善”?這個(gè)重任實(shí)際上就落到了他們的醫(yī)療大數(shù)據(jù)平臺(tái)上。
真正制約醫(yī)療大數(shù)據(jù)發(fā)揮價(jià)值的主要瓶頸,在于數(shù)據(jù)平臺(tái)從集成到處理,再到應(yīng)用這三個(gè)維度的能力。這就意味著,僅僅將數(shù)據(jù)從不可用變?yōu)榭捎?,只是醫(yī)渡云使命的起點(diǎn),如何在可用數(shù)據(jù)的基礎(chǔ)上構(gòu)建出相應(yīng)的應(yīng)用,同樣是至關(guān)重要的一個(gè)環(huán)節(jié)。
如今,在數(shù)據(jù)智能驅(qū)動(dòng)下,其核心基礎(chǔ)“醫(yī)學(xué)數(shù)據(jù)智能平臺(tái)“已經(jīng)搭載了300多個(gè)應(yīng)用模塊,貫穿整個(gè)醫(yī)療過(guò)程。
例如在臨床輔助診療上,結(jié)構(gòu)化數(shù)據(jù)按照不同的功能模塊呈現(xiàn),準(zhǔn)確反映每個(gè)患者在其整個(gè)治療周期中的病情進(jìn)展,DPAP通過(guò)對(duì)散落的數(shù)據(jù)整合,構(gòu)建患者的時(shí)間軸模塊,以診療事件時(shí)間為主線,完成疾病數(shù)據(jù)建模;從疾病的角度來(lái)看,DPAP還能夠提供疾病數(shù)據(jù)模型。而無(wú)論是疾病數(shù)據(jù)模型,還是患者診療模型,這都是臨床科研、路徑挖掘、療效評(píng)價(jià)、輔助診斷應(yīng)用的基礎(chǔ)。
根據(jù)國(guó)際國(guó)內(nèi)醫(yī)學(xué)標(biāo)準(zhǔn),目前醫(yī)渡云已經(jīng)完成了對(duì)不少疾病的不同核心信息的整合和識(shí)別,構(gòu)建出25個(gè)大病種、3000多個(gè)疾病的模型,而這個(gè)成果數(shù)字還在不斷擴(kuò)大。
目前,支撐醫(yī)渡云所擁有的300多個(gè)功能模塊的技術(shù),涵蓋了近年來(lái)頗為關(guān)鍵的基礎(chǔ)算法和人工智能技術(shù),涉及到醫(yī)學(xué)自然語(yǔ)言處理、醫(yī)學(xué)影像處理、醫(yī)學(xué)知識(shí)圖譜構(gòu)建、醫(yī)療大數(shù)據(jù)挖掘、大規(guī)模(深度)機(jī)器學(xué)習(xí)模型及應(yīng)用等,這其中有多個(gè)項(xiàng)目,更是目前全球?qū)W術(shù)研究發(fā)展的熱點(diǎn)所在。
爬過(guò)15座山之后迎來(lái)質(zhì)變
系統(tǒng)開發(fā)完成后,新的挑戰(zhàn)就是落地。醫(yī)渡云在2017年開始將產(chǎn)品推向商業(yè)化,現(xiàn)在國(guó)內(nèi)排名前 150 的醫(yī)院有超過(guò)三分之二成了它的客戶。
“究竟是怎么辦到的?”得到的答案很誠(chéng)實(shí)且很誠(chéng)懇,“就是慢慢做,第一家是最難的,花了 1 年 2 個(gè)月才上線,前 15 家?guī)缀鯖](méi)有網(wǎng)絡(luò)效應(yīng),產(chǎn)能上不去,很痛苦,”宮如璟回憶說(shuō)。
醫(yī)渡云在 2013 年成立時(shí),盡管行業(yè)能接受這種大數(shù)據(jù)、AI 創(chuàng)新的理念,但部分醫(yī)院的策略仍偏保守,更大程度上是出于與商業(yè)公司進(jìn)行數(shù)據(jù)合作在數(shù)據(jù)安全性與合規(guī)性上的擔(dān)心和不安。醫(yī)渡云的數(shù)據(jù)安全技術(shù)、數(shù)據(jù)合規(guī)保障機(jī)制一步步被醫(yī)院感知,這一瓶頸才被打破。
就這樣,醫(yī)渡云的應(yīng)用產(chǎn)品一步一步吸引了許多專家、醫(yī)院,磁吸效應(yīng)逐漸產(chǎn)生,而且“機(jī)器”看多了、學(xué)多了,系統(tǒng)就變得更聰明。例如中山大學(xué)附屬腫瘤醫(yī)院攜手醫(yī)渡云進(jìn)行大數(shù)據(jù)戰(zhàn)略合作,并在業(yè)內(nèi)知名的《柳葉刀》(The Lancet)期刊上發(fā)表了與鼻咽癌相關(guān)的論文。目前雙方在鼻咽癌、結(jié)直腸癌和肺癌等方面都有科研合作。
“在跨越了 15 家客戶后,平臺(tái)網(wǎng)絡(luò)的價(jià)值快速擴(kuò)大,量變產(chǎn)生質(zhì)變”?,F(xiàn)在醫(yī)渡云已處理醫(yī)院10幾年的數(shù)據(jù),完全不用人工,最快兩周就可以完工上線。
醫(yī)療行業(yè)是一個(gè)門檻很高的行業(yè),再加上科技巨頭、初創(chuàng)公司全都聚集于此,競(jìng)爭(zhēng)更加激烈,但宮如璟毫不畏懼,她的信心來(lái)源很簡(jiǎn)單也很困難,就是團(tuán)隊(duì)的技術(shù)實(shí)力。
宮如璟在英國(guó)求學(xué)期間蟬聯(lián)了五年全英數(shù)學(xué)冠軍,在華爾街投行 14 年的歷練;CEO 孫喆曾聯(lián)合創(chuàng)立北京惠旭金信,主要關(guān)注醫(yī)療行業(yè)投資,在醫(yī)療行業(yè)有豐富的投資和經(jīng)營(yíng)實(shí)踐經(jīng)驗(yàn)。
CTO 徐濟(jì)銘則是中國(guó)科學(xué)院研究生院計(jì)算機(jī)應(yīng)用專業(yè)碩士,曾負(fù)責(zé)百度搜索服務(wù)團(tuán)隊(duì)、框計(jì)算團(tuán)隊(duì)等核心技術(shù)團(tuán)隊(duì),也曾獲選百度最有價(jià)值員工。首席戰(zhàn)略官(CSO)何直,早先曾是阿里巴巴集團(tuán)產(chǎn)品總監(jiān),領(lǐng)導(dǎo)了天貓大數(shù)據(jù)平臺(tái)建設(shè),在連續(xù)創(chuàng)業(yè)的歷程中,先后創(chuàng)立了專攻大數(shù)據(jù)挖掘的精準(zhǔn)營(yíng)銷軟件及服務(wù)的杭州數(shù)云信息等四家公司。
宮如璟笑著說(shuō),現(xiàn)任首席數(shù)據(jù)科學(xué)家彭濤,“還是當(dāng)時(shí)跟今日頭條搶的,他加入的原因是他覺(jué)得我們的東西更難,有挑戰(zhàn)”。很多員工都是基于想要一起改變中國(guó)醫(yī)療現(xiàn)狀的這股熱情而加入。
去年底,醫(yī)渡云找來(lái)了前微軟亞洲研究院資深研究經(jīng)理,專攻自然語(yǔ)言處理與知識(shí)工程研究的閆峻,出任首席人工智能科學(xué)家,并且延攬了美國(guó)斯坦福大學(xué)統(tǒng)計(jì)系教授王永雄,擔(dān)任首席數(shù)據(jù)科學(xué)顧問(wèn),強(qiáng)化了這家學(xué)霸公司的陣容。
隨著業(yè)務(wù)快速增長(zhǎng),團(tuán)隊(duì)人數(shù)過(guò)去幾年都是翻倍的增長(zhǎng),到了今年底預(yù)計(jì)會(huì)達(dá)到 800余人,其中研發(fā)團(tuán)隊(duì)占比高達(dá)60%以上,大部分都是來(lái)自全球/國(guó)內(nèi)的知名互聯(lián)網(wǎng)公司和頂尖實(shí)驗(yàn)室;還有20% 的團(tuán)隊(duì)是完全專注在醫(yī)學(xué)領(lǐng)域,因此整家公司有高達(dá) 80% 以上的人力資源都是在做醫(yī)療領(lǐng)域研發(fā)。
跨區(qū)整合,數(shù)據(jù)智能輻射至藥物研發(fā)和醫(yī)保
在與醫(yī)療機(jī)構(gòu)的順利合作之后,醫(yī)渡云將目光放得更遠(yuǎn)。孫喆透露,建立跨區(qū)的數(shù)據(jù)中心將是今年的工作重點(diǎn),預(yù)計(jì)建立 10個(gè)左右省級(jí)層面的區(qū)域醫(yī)療數(shù)據(jù)中心。
醫(yī)療數(shù)據(jù)中心會(huì)把當(dāng)?shù)氐娜揍t(yī)院、二級(jí)、三級(jí)醫(yī)院的數(shù)據(jù)通通集中到這個(gè)區(qū)域的云平臺(tái)上,因?yàn)榭缭簲?shù)據(jù)的集中共享,幫助患者能夠建立起一個(gè)完整的患者健康檔案,患者不必帶著病歷到處跑,醫(yī)院之間也能有效的為患者做全面的健康類服務(wù)。
對(duì)于藥物研發(fā)的效益,醫(yī)渡云希望推動(dòng)醫(yī)院和醫(yī)院之間的聯(lián)合。例如每一家醫(yī)院現(xiàn)在都有自己的新藥研發(fā)基地,當(dāng)制藥企業(yè)某個(gè)新藥研發(fā)項(xiàng)目聯(lián)合區(qū)域的時(shí)候,承接能力會(huì)變得更強(qiáng),將會(huì)加快新藥上市。“同時(shí)也可對(duì)政府提供整個(gè)公共決策的支撐”孫喆強(qiáng)調(diào)。
去年,醫(yī)渡云與重慶醫(yī)科大學(xué)聯(lián)合共建了重慶醫(yī)科大學(xué)醫(yī)渡云醫(yī)學(xué)數(shù)據(jù)研究院,成為國(guó)家首個(gè)醫(yī)學(xué)數(shù)據(jù)二級(jí)學(xué)院。一同與國(guó)家食品藥品監(jiān)督管理總局(CFDA)展開了藥品不良反應(yīng)的合作,基于整個(gè)重慶區(qū)域人群分析基礎(chǔ)之上,有效分析出該區(qū)域的藥品使用情況、具有重慶特殊性的不良反應(yīng)等,這就是區(qū)域平臺(tái)的龐大效能。
通過(guò)這樣的合作,除了了解中國(guó)藥品不良反應(yīng)的發(fā)生情況,還有一個(gè)很大的意義在于拉動(dòng)制藥產(chǎn)業(yè),以及建立一個(gè)聚集產(chǎn)管學(xué)研力量的優(yōu)質(zhì)監(jiān)測(cè)機(jī)制。
由此可見(jiàn),醫(yī)渡云的服務(wù)已經(jīng)從最初只面向醫(yī)療機(jī)構(gòu),走到了區(qū)域平臺(tái)、輔助公共決策的層次上。
不久前,醫(yī)渡云也與南京醫(yī)科大學(xué)簽約,作為合作伙伴承建江蘇省轉(zhuǎn)化研究院國(guó)家級(jí)新藥創(chuàng)制項(xiàng)目的信息平臺(tái),致力于“讓藥品的研發(fā)必須朝品質(zhì)更好、更安全、更便宜”。
除了臨床試驗(yàn)外,新藥上市后的不良反應(yīng)監(jiān)管一直也是業(yè)界的難題。
傳統(tǒng)模式下,這種監(jiān)管依賴于醫(yī)生的主動(dòng)上報(bào),或者企業(yè)需要調(diào)動(dòng)非常多的人力資源,在新藥上市后去醫(yī)院采集相關(guān)的信息。整個(gè)過(guò)程高度容易產(chǎn)生錯(cuò)誤、疏漏。為了解決這個(gè)問(wèn)題,醫(yī)渡云承接了重慶醫(yī)科大學(xué)和CFDA 不良反應(yīng)管理中心的專項(xiàng)課題,研發(fā)基于大數(shù)據(jù)和算法的智能監(jiān)察系統(tǒng)。
而制約醫(yī)療行業(yè)變革的另一個(gè)核心因素則是醫(yī)保的管理。只有醫(yī)保作為支付方能更加科學(xué)的去評(píng)估一個(gè)疾病的支付方式和定價(jià),才能從根本上幫助整個(gè)醫(yī)療市場(chǎng)形成良性循環(huán)。
近期,醫(yī)渡云即將宣布與清華大學(xué)自動(dòng)化系合作建立智慧醫(yī)療自主系統(tǒng)聯(lián)合研究中心,針對(duì)醫(yī)保領(lǐng)域的應(yīng)用從理論和方法上進(jìn)一步深入創(chuàng)新。未來(lái)面向醫(yī)保的應(yīng)用不論是核心技術(shù)或系統(tǒng)架構(gòu)設(shè)計(jì)將會(huì)不停向上升級(jí)。
醫(yī)渡云現(xiàn)在正在做的,就是幫助醫(yī)療產(chǎn)業(yè)和外部產(chǎn)業(yè)融合。近日,醫(yī)渡云與人民健康在醫(yī)療大數(shù)據(jù)領(lǐng)域推動(dòng)醫(yī)療創(chuàng)新產(chǎn)業(yè)發(fā)展、共同搭建人民健康云平臺(tái)、醫(yī)療數(shù)據(jù)質(zhì)量評(píng)價(jià)體系研究與評(píng)價(jià)標(biāo)準(zhǔn)制定等方面開展廣泛合作,在醫(yī)療健康服務(wù)創(chuàng)新領(lǐng)域開展積極探索,助力“健康中國(guó)”戰(zhàn)略實(shí)施和“國(guó)家大數(shù)據(jù)戰(zhàn)略”落地。這不僅牽涉到14億人的健康,如果發(fā)展得順利,還可以為全人類做出貢獻(xiàn)。畢竟,互聯(lián)網(wǎng)+醫(yī)療健康已經(jīng)為中國(guó)醫(yī)療行業(yè)變革的重要舉措,醫(yī)渡云將披荊斬棘、砥礪前行。
合作咨詢
肖女士 021-33392297 Kelly.Xiao@imsinoexpo.com