疫情面前,醫院是否需要數據中台?

csdn 發佈 2020-01-28T17:15:32+00:00

一方面市值熠熠,一方面網際網路成為數據應用技術的發源地,數據中台也在其中萌芽。湯道生說:「中台能力以前就有,只不過它們大多服務於內部業務,在產業網際網路時代才開始逐漸對外開放這些技術積累。」

本文經授權轉載自親愛的數據(ID:deardata)

作者 | 譚婧

責編 | 胡巍巍

中國網際網路的今天,市值總和接近10萬億人民幣,頭部阿里巴巴、騰訊各有4000多億美元市值。一方面市值熠熠,一方面網際網路成為數據應用技術的發源地,數據中台也在其中萌芽。

騰訊湯道生說:「中台能力以前就有,只不過它們大多服務於內部業務,在產業網際網路時代才開始逐漸對外開放這些技術積累。」

京東黎科峰也坦言:「公司在一輪又一輪組織架構調整之後,將數據中台提升到了重視的新高度。」

這一切只是聚光燈下數據中台的冰山一角,數據中台作為從業務視角而非技術視角的技術,應用已經慢慢地向傳統領域滲透。

2019年,佛山市婦幼保健院馬麗明主任在演講《中國醫療機構新一代數據中台建設的探索》中講述了在數據戰略時代,醫療信息化工作者不易的摸索之路,也表達了醫院場景對於人工智慧技術的真實需求。

醫院信息化的基礎設施好比是地基。而現實是,地基之上的建築物並不能等到基礎設施完全到位了才開始起步。中國醫院的信息化步伐與人工智慧技術的落地都在同一片工地里熱火朝天地開工。

數據中台的需求背景

眾所周知,新醫改的核心就是「騰空間、調結構、保銜接」。騰空間,就是騰出地方,讓出空間,包括取消藥品加成和採用兩票制集中採購壓縮藥品中間環節的利潤,同時規範醫療服務行為。

通過調整醫療價格、服務價格來調整醫療現在的結構,藥品大型檢驗、檢查的價格往下調,能夠體現醫務人員技術勞動價值往上升。

結構性的調整對醫院機制帶來很大影響。新機制必須要跟社保和財政補償銜接好。公立醫院的院長在這關鍵時期面臨挑戰。

確保醫療質量的前提下,減少過度醫療,提高服務質量是工作的重中之重。但是,如何提升才是關鍵。在這個情況下,數據分析有了新的歷史使命,新醫改為信息化賦能臨床提供了加速度。

1999年,中國醫療機構信息化開始。

2010年,一個十年的數據積累期。

2019年,一個十年的數據匯通期。

預計在2021年後,邁向數據應用期。

產業實現從醫療數字化,到醫療智能化需要跨越兩個門檻。

第一個,以技術為核心,向以數據為驅動轉變,需要醫療機構信息中心有非常多的數據專家。美國很多醫院的信息中心幾百甚至幾千的人才規模,其中大部分是數據專家。但是,現在國內醫療機構的數據專家很少。

第二個,「全科一體化」向「專科定製化」轉變,醫療信息化工作者需要更加熟悉臨床業務和流程。

不僅如此,醫療信息化工作者還面臨以下幾個挑戰,

挑戰一,如何利用數據賦能業務?簡單來講,讀懂數據。首先要實現數據的互聯互通,集成標準化和結構化。通過優質數據,定位臨床質量和效率問題,從而分析問題背後的原因。

根據發現的問題,使用輔助決策系統改善醫療質量,解決臨床問題,提升臨床效能。同時,能提供指標參數,進入下一輪的管理,怎麼去更好地做控制和調整。

挑戰二,專科發展速度非常迅猛,很多的專科系統面臨著井噴,可以看到胸痛、靜脈血栓栓塞症(VTE)、房顫、卒中和膿毒症,這麼多的專科系統都有特定的專科知識,專有的診療規範,特定的服務環節、專有指控和數據分析指標。

這給醫院信息中心帶來了很大的困擾。需要面對很多的廠家,一個病、每一個系統都可能是不同廠家提供的產品,需要大量的協調。每個系統都有自己的硬體要求,都需要硬體的投入。每個系統都要去做接口,支持集成平台的方式,造成了大量的重複工作。都有自己的標準,最終沒了標準。

更關鍵的一點是,各個系統之間是交叉的。可能某個疾病的知識體系改變了,會影響相關係統的使用。比如靜脈血栓栓塞症的知識改變了,會影響抗凝藥物的使用推薦。

信息化必須解決五大核心問題,

第一,數據集成,數據的匯集結構化、標準化。

第二,數據洞察,形成模型。

第三,平台化,兼容多應用的開放式平台支持各種應用。

第四、解決數據決策,形成各種臨床的應用產品。

第五、業務重塑。場景化人機協同,同時還要結合的業務進行改進和提升。

數據驅動下的新架構集成平台應該在中間,再加上的業務中台、數據中台,兩大中台作為支撐。

在今天的環境下,醫院對數據中台的需求是呼之欲出的。

數據中台的構成

雖然對業界對數據中台的定義還沒有達成共識,廠家和專家對數據中台的標準和意見都有所不同。但是,現實工作已經實踐出了主要結構。數據中台至少應該是要包括五個主要部分:

第一,數據的標準化和結構化。

第二,數據的聚類和轉化,形成業務所需要的信息。

第三,數據指控和監控,保證的數據質量。

第四,構建指標體系。

第五,統一對外的服務。向下發展提高性能,保障數據的應用能力。向上拓展能夠提高數據應用的價值和賦能業務。

數據中台可以比喻為建房子,如果所有的建築組件都是以一塊一塊磚頭為單位去建,速度很慢,建房子的又不止一個人,又有很多的系統。應用落地的速度受限。

因此,可以把一些重複性的、反覆使用的做成標準部件。例如一體化的洗手間、門窗,這些是數據中台要管理的東西,通過標準化的部件統一提供服務。

數據中台主要分成兩大部分,第一,數據處理,第二,對外服務的中台。先把這些跟企業業務有較強相關性的部分抽取出來,把經常反覆使用的抽取出來。數據中台要滿足這種快速疊代、快速應用的需求,同時又要兼前顧後。

數據中台的能力與業務流程

數據中台具備統一的能力,統一的數據存儲能力,數據計算能力和數據的應用能力。數據中台必須要能夠完成各種數據模型,包括基礎模型和融合模型,標籤和算法,還有質量控制管理和數據的安全管理。

馬麗明主任談到,現在服務中台已經比較成熟了,而各個醫院建立了數據中台的並不多,都還在起步探索階段。

醫院微信的服務中台,應用層不包括複雜的業務邏輯,只做呈現和轉換,但是服務層已經實現了服務的微小化管理,每個業務單獨的服務分級管理。

因為服務性、可用性的要求不一樣,像挂號,可就採取N加1的部署,像信譽度管理、檢驗檢查,這些實時性要求不高,或者是患者用得不多的,這部分的業務需求標準可以適當降低。

所以,分級管理把數據變成一個個細顆粒度的資源,資源通過統一的API的方式給業務邏輯層即可。

流程改變,業務邏輯改變,只需要修改業務邏輯層。能夠同時提供給多方使用,只需要改一個地方,所有的都是用統一服務的方式,需求導向結果。所以,數據中台是非常有必要的,主要要做幾件事情:

第一,構建統一的測速與以及映射體系,這是一切標準化和結構化的基礎。

第二,在術語制定的時候,可以參考國內外的權威臨床數據集。

第三,結合國內臨床數據使用的習慣和本土的表達,從而形成能夠滿足用戶查閱的中文標準的術語體系。

術語的範圍包括這幾部分,

第一個,疾病、症狀、實驗室的檢查、手術操作、病理的症狀體徵等臨床診療信息。

第二個,通過自然語言處理(NLP)和本體映射的方式,實現數據標準化和結構化。

第三個,構建統一疾病數據模型,形成數據資產目錄。

數據資產化的本質是要有足夠的顆粒度和維度,直接用於業務場景。比如說患者畫像、醫院畫像、設備畫像。

通過業務反推的方式和基於患者信息聚合衍生的方式,構建隨取隨用的數據。數據裡面保存的不僅僅是患者的信息,還包括了很多的標籤。

重構流程的關鍵是,只有深入到臨床路徑,才能發現更深層次的信息。首先是要匹配業務需求,然後根據需求對流程進行優化。

梳理的過程包括,首先收集指南,再把指南按照疾病的主流程進行拆解,從而形成決策樹。羅列疾病核心變量,變量可能不夠,需要結合業務需求直接反饋信息,臨床研究表單收集內容,補充疾病變量。把兩者整合在一起,從而形成疾病數據模型和運營模型。

除了數據分類存放有利於數據有效利用,數據資產目錄也很重要。舉個例子,靜脈血栓栓塞症(VTE)需要管理的指標非常多,包括診療過程的指標,診斷類指標以及診療結局指標。

例如,診療過程指標,包括靜脈血栓栓塞症(VTE)風險評估比率、出血風險評估比率。診療結局指標,包括醫院相關性靜脈血栓栓塞症(VTE)發生比率,靜脈血栓栓塞症(VTE)相關病死率。

這些防控指標並不是直接就能收集到,往往在收集到靜脈血栓栓塞症(VTE)風險評估之後的數據,才能計算出來。只有這樣,才能更好地輔助各類業務的應用。

談到構建統一的疾病為核心的知識庫,至少要包括這三部分,

第一,通用的知識,包括常見的藥品知識檢驗、檢查知識。

第二,模塊化疾病知識,包括了篩查診斷手術和操作指引和知識。

第三、疾病知識,包括疾病指南和專家共識。

在知識庫基礎上,還要構建指標標準管理體系,至少要包括五部分,

第一、流行病學數據。

第二、臨床路徑和指南。

第三、醫院和科室的質量標準。

第四、國家對重大疾病的要求。

第五、國家管理相關的機構設定的醫院運營的指標(DRGs)。基於數據資產和指標標準,才能定準確的定位,發現問題,定位臨床問題。更好地判斷是過度醫療,還是檢查不足。

構建統一的數據質量和監控體系是質控體系重中之重。在指控當中有至少是有三個事情是必須。

第一、一致性。

第二、標準化,

第三、合理性。

如果有條件,最好是能夠把內容質控也加進去,最好能在使用前進行監控,對於能夠及時發現醫療質量問題和風險有非常大的幫助。

另外,開放的APIs,統一數據中台支撐多種的業務數據的應用,做開放式的接口服務數據中台。

開放接口服務有幾個好處,第一是簡化管理。對接會變得很簡單,然後很快速,排錯也容易,能夠減少數據治理工作量。如果每個系統接入,都要去做數據治理,都要去做對標還是蠻痛苦的。

第二、數據安全。不需要全部開放數據給某一個應用,只需要提供業務所需的最小級,可以減少不必要的數據暴露,還可以做統一的脫敏轉化,從而更好地保護患者隱私和醫院的數據資產。

這方面國外已經有很好的應用案例,像史丹福大學用於慢性疼痛患者管理的健康信息註冊網絡,是開源、開放標準的,高度靈活的系統平台。基於臨床的知識決策的推薦,為臨床的醫生提供最佳的實踐路徑,並提供臨床結果追蹤的決策支持。

人工智慧輔助臨床診療決策的需求是非常巨大的,也是真實的。在此處,馬麗明主任談到一個性命攸關的案例,一個小朋友兩三天前在醫院看病時還好好的,突然間,急重症肺炎轉到重症加強護理病房,短短几天,從活蹦亂跳到性命垂危。

重症肺炎在國內存在很大的問題,其中一個問題是部分低年資醫生沒有辦法對重症肺炎進行百分百的準確識別。

雖然國家已經有很明確的診斷標準。但問題的難點在於潛在的重症患兒早期症狀不明顯,而病情惡化快,可能兩三天前根本就沒有什麼太特別的症狀,突然間就要進重症加強護理病房了。

臨床識別非常困難。起病急,病情重變化又快。如果能夠在早期識別病情,提早採取措施,會大大降低重症肺炎的病型病死率。

國外已有可以參考的案例,美國杜克醫療(Duke Health)基於人工智慧技術,針對膿毒症的不同症狀表現進行預警的建模,對及時發現膿毒症起了很大的幫助。再比如敗血症,平時表現和很多急性感染的表現是一樣的。

也就是說,敗血症本身並無特殊臨床表現,敗血病的臨床表現也可見於其他急性感染。人工智慧建模預警在第一次抗生素給藥前17個小時就已經檢測到敗血症。所以,非常期待國內有更多的人工智慧公司能夠給醫務人員帶來更多的幫助。

馬麗明主任深刻的回顧了數據中台在醫院的應用與發展,也講述了來自醫療前線的真實需求。

在數字化浪潮賦能百業千行的時代背景下,數據中台等基礎建築拔地而起,人工智慧技術努力深入場景,雙輪同軌。

在文章的最後,簡單地提一下國內的人工智慧企業在醫院場景下取得的進展。

據悉,長春市某知名婦產醫院在新生兒體重場景使用第四範式AutoML技術取得很好的效果。因為體重是衡量兒童生長發育的重要標誌,預測新生兒體重對知曉新生兒的健康狀況,指導孕婦分娩的方式都有意義。

可惜目前教科書上的辦法還停留在用腹圍、雙頂徑、股骨長几個指標用簡單公式計算。臨床實踐表示,舊的計算方法非常不准,幾乎已沒有指導意義。因此,醫院希望嘗試用人工智慧的方式去解決。

而AutoML技術應用在這個場景下,模型預測的絕對誤差僅為百克。如果該技術能夠在全國範圍內應用,預測全國各個地區新生兒體重數據,將有可能從更多的新生兒體重數據中挖掘出更大意義與價值。

作者簡介:譚婧,虎嗅專欄作者,《親愛的數據》公眾號創始人,香港浸會大學碩士,N年前高考作文滿分得主。曾負責中國節能集團控股企業戰略管理工作,許多年管理諮詢經驗,也曾任人臉識別創業公司合伙人。

關鍵字: