更懂醫生的嘉和美康,其大資料臨床科研平臺都有哪些亮點?
資料重複採集,利用率低;
資料儲存分散且結構不一;
資料質量和完整性缺乏統一監控;
資料查詢邏輯複雜;
醫學研究階段性驗證困難;
研究思路難挖掘……
類似上面這些臨床科研的問題,還有很多。終歸而言,提高醫療資料的質量才是解決問題的關鍵。
目前,患者的病案在絕大部分醫院都以非結構化或半結構化的方式進行儲存。這種資訊,醫生難以直接利用,只能採用人工謄寫或摘抄的方式整理資料,極大地增加了科研資料採集的時間成本。
此外,科研資料根據課題研究目的不同,往往來源於多個業務系統。並且根據治療方式和階段的不同,資料的類別也具有多樣性,如患者的隨訪、CRF表單以及生物樣本、組學分析等資料。這就造成了,醫生在實際資料收集和整理過程中,需要來回在多個系統間切換,並將多系統來源的資料人工進行關聯核對,因此錯誤成本顯著提升。
除此之外,科研課題如何切入,如何實現創新型的研究思路和觀點,也困擾著當代的醫生群體。
基於以上問題,以大資料為基礎的科研平臺在研究型醫院建設過程中逐步體現出其重要的位置和優勢,也成為近年來,以大資料為基礎的新型臨床研究模式的新熱點。
> > > >
從臨床系統到科研大資料平臺
大資料平臺通常基於Hadoop技術,實現海量異質資料,包括非結構病歷資料與大規模影像資料的標準化儲存,並通過自然語言處理(NLP)等技術實現資料的標準化、規範化處理。同時,大資料平臺所彙集的醫療資料,還為深度學習等方法提供了海量訓練與驗證集,從而推動了醫療資料智慧分析的發展。
時下大熱的病歷資料的自然語言處理以及醫療影像的AI分析,其基礎便是大資料平臺。
作為國內電子病歷的代表性企業,嘉和美康從2013年起便開始了大資料平臺的研發和探索。經過幾年的沉澱,嘉和美康逐步實現了Hadoop、Spark、機器學習等大資料相關技術的成熟應用。而以往電子病歷等臨床系統專案的積累,也為公司大資料模型的建立打下了堅實基礎。
2017年,在醫院醫生越來越強烈的科研需求下,嘉和美康大資料事業部正式推出了大資料臨床科研平臺。
嘉和美康供圖
據動脈網瞭解,該平臺主要藉助大資料處理、自然語言分詞、機器學習、知識圖譜等技術,整合並挖掘包括電子病歷、檢驗檢查、醫療影像、基因序列等在內的海量醫療資料,形成以患者為中心的完整時間序列研究資源庫。此外,平臺還利用資料探勘演算法,實現臨床資料的深度解析與視覺化,輔助臨床醫生構思科研想法以及提出病因假設。
從效率上看,大資料臨床科研平臺基於大樣本臨床試驗,能夠快速完成問題驗證並生成統計結果,降低科研成本,提升醫療機構服務質量和科研成果轉化效率。
> > > >
五大優勢功能
大資料臨床科研平臺,在國內並不少見。嘉和美康大資料事業部憑藉多年對臨床資料深入透析經驗,建立起了五大產品優勢:
1
多級資料分層模型
嘉和美康大資料事業部的大資料臨床科研平臺針對臨床資料複雜的分級結構,特別是病歷文書、檢查報告等,研發出了“多級資料分層模型”。該模型能深度挖掘各層次資料,把資料的顆粒度做到極致,並建立其層次關係,從而能支撐複雜關聯性分析等深度的科研應用研究。
據嘉和美康大資料事業部科研產品部總監甘偉介紹:“多級資料分層模型的資料顆粒度優勢,主要建立在病歷的複雜結構程度上。經過多年電子病歷系統的研發,目前嘉和美康的系統已經覆蓋了全國1200多家醫院,對病歷的理解十分深刻。所以在分析資料時,要比其他公司分析得更為細緻,顆粒度更小。”
舉例來說,如果醫生想要研究飲酒對某種疾病的影響,首先第一層要觀察其是否飲酒,第二層要觀察其酒齡,第三層要研究其喝的是紅酒、白酒或者是其他型別的酒。對疾病的差異分析,顆粒度越細,醫生研究得也就越深入。
2
專病庫
嘉和美康大資料事業部的大資料臨床科研平臺專病庫是以專科疾病為中心,整合患者在院期間,包括門急診在內的各類臨床診療資料,具體包括病歷文書、檢驗檢查、醫囑用藥、手麻、護理等。
除此之外,患者隨訪資料、生物樣本資料、組學研究資料或公開發布的環境質量資料,以及一些自主維護的課題庫資料以及疾病專有標籤資料,也被納入到專病庫中。
基於專病庫,科研PI(課題負責人)可以不用再像以前一樣,帶著研究生去病案室耗時耗力地翻閱紙質病案,摘取關鍵資訊點。
另外,醫生的視野往往依賴於過往的臨床經驗,因此發現的臨床問題也很侷限。但當其有了基於多學科資料的專病庫之後,便可以藉助科研平臺,對海量資料進行多維度分析。利用視覺化功能,醫生能夠發現過去難以發掘的臨床問題,找出科研的新思路。
嘉和美康供圖
3
資料智慧質控
評價一份病案的質量往往需要從兩個角度出發,從形式上包括組成部分的完整性、實效性、格式規範性,從內涵上要求內容準確、詳實,能滿足思辯和學術探討。
過去,醫院多以人工方式開展病案質控。如某三甲醫院,聘請了30多位資深臨床專家組成病案內涵質控專家組。同時,每月有數十位主任、教授、主治醫師對科室病案進行自查。
智慧質控,是指通過明確一些常用的質控規則,再通過機器學習,補充和完善質控體系。嘉和美康大資料事業部針對大資料資源庫每個資料項,實現實時多級的質量監控,包括資源的完整度、異常資料點、異常資料型別以及資料分佈情況等。並可針對不規範資料進行溯源分析,追溯到原始病歷文書,發現書寫誤差。比如入院記錄裡的評分和出院記錄的評分不一致,確定診斷和患者的症狀不符等。
據甘偉介紹:“一方面,醫生可以對所需資料的資料質量一目瞭然;另一方面,他還能及時發現問題,儘早採取培訓、必填項等方式規範醫生病歷書寫,從源頭提高資料質量。”
4
資料深度挖掘
嘉和美康大資料事業部的大資料臨床科研平臺的資料深度挖掘能力包括兩大特點:病種分析和線上統計建模。
1) 病種分析
病種分析提供影響因素分析、預測分析、干預分析三大核心主題的分析研究。
影響因素分析,圍繞專病相關幾千個維度分析挖掘疾病的危險因素,並進行分類排名;有利於進行疾病的相關性分析的同時,還可以挖掘出影響平均住院日等運營指標的相關因素,從而定位相關業務環節,進行鍼對性的調控。
預測分析,通過學習相關真實病歷,藉助時間序列分析、神經網路等大資料探勘技術,構建疾病預測模型,實現對患者相關疾病危險因素預測分析、疾病嚴重程度分級,治療效果評估。同時,還支援對門診量、住院量、手術以及相關費用的預測,為醫院運營管理提供參考。
干預分析,針對用藥、手術、放療等治療手段,進行關鍵事件前後的對比分析,從而直接產出治療效果對比報告。
2) 線上統計建模
過去,醫生寫科研論文之前,需要把excel表的資料處理成統計軟體能用的格式。這個過程中,需要耗費很長的時間,包括一些資料轉化、空值處理,以及一些資料的不規範。利用科研平臺,醫生不需要再像以前一樣,只需通過平臺將資料處理好,量化成統計軟體需要的格式即可。
資料統計方面,嘉和美康大資料事業部還提供線上統計模型工具。
目前,科研平臺已整合醫學上常用的統計演算法40餘種,包括獨立樣本T檢驗、卡方檢驗、迴歸分析、相關分析以及Cox迴歸等。其操作設計完全結合醫學專業特點以及科學研究思路,將大部分資料處理和量化過程轉由後臺直接完成,省去人工處理資料的複雜度,提高科研效率。
且考慮到臨床醫生統計學知識匱乏的現狀,平臺上還智慧的融合了統計模型推薦以及模型結果解析等。分析後的結果可直接匯出,供醫生撰寫論文中時使用。
5
資料匯出
平臺可針對資料的分類模型,定製每種分類資料的匯出模式,基於關鍵事件處理、複雜邏輯計算、自動行列轉換、智慧標準化值域輸出等新技術。替代統計學處理之前大量的手工資料處理工作,為醫生在階段性統計階段節省大量時間。
> > > >
不限於院內,廣闊的應用空間
大資料臨床科研平臺的應用場景,並不限於醫院內。
在臨床輔助方面,科研平臺通過對真實世界資料的學習,包括網上疾病的一些診療指南建立起的知識庫,輔助醫生規範其診療行為。讓不管是進修醫師還是資深醫師,都能夠根據知識庫,將相應的治療方案推薦給醫生,讓他快速完成工作,減少失誤的概率。
除此之外,在一些拓展領域,科研平臺也有著廣泛的應用價值。
甘偉表示:“除了為醫院和醫生端提供服務之外,嘉和美康目前已經聯合CRO公司,輔助藥廠去做一些三期四期的臨床評價,以及藥品的適應症和一致性評價的研究。後續,嘉和美康大資料事業部還計劃與保險公司合作,為其提供醫保控費、保單設計、不良記錄的核查等方面的服務。”