麥肯錫專家賜你三枚錦囊:搭建高質量醫學 AI 研究專案
編者按:這是一篇發表於《哈佛商業評論》的醫學研究案例。文章作者包括 Rafiq Ajani,麥肯錫位於馬薩諸塞州沃爾瑟姆的辦事處的合夥人,並領導該公司的北美知識中心;Arnaub Chatterjee,麥肯錫北美知識中心的高階專家,也是哈佛醫學院的教學助理;Aniketh Talwai,麥肯錫北美知識中心的專家;Jack Zhang,麥肯錫北美知識中心的專家。
這些專家集中介紹了麥肯錫北美知識中心與一家制藥公司在非霍奇金淋巴瘤(NHL)領域的合作臨床研究,通過機器學習技術對於患者的電子健康記錄資料分析與其他資料融合處理分析,實現預測患者病情發展趨勢以及尋找最優治療方案。
基於該案例的實戰經驗,麥肯錫北美知識中心的專家們提取出構建醫學領域 AI 研究專案過程中最為核心的三項指導原則,包括如何搭建完整的團隊架構、如何整合有效資料集合以及多次迭代與驗證開發的重要性,以供其他藥物研發公司或者醫療研究機構分享和參考。
在醫療保健領,越來越多的真實資料域讓研究人員興奮不已。據估計,健康資料量每年增長 48%,而過去十年來,個人醫療資料的收集和體量正呈現高速發展的態勢。
在這些資料中,電子健康記錄(EHR)提供了產生新見解和重塑理解患者護理的的最大機會之一。(一份完整的電子健康記錄通常包括患者的過敏史、醫療保險資訊、家族遺傳病史、免疫狀況、身體狀況或疾病資訊、服用藥物清單、住院記錄、手術資訊等。)
此前,分析 EHR 資料的瓶頸在於需要能夠在短時間內處理大量資料的工具。當下,人工智慧,更具體地說,機器學習,這已經開始打破計算能力的瓶頸,開始重塑藥物研發和醫學成像等領域的研究模式,但這只是個開始,如今,機器學習的觸角開始伸向醫療保健領域。
下面來看看我們和一家制藥工作的合作專案。該專案將機器學習應用於 EHR 和其他資料,以預測某種非霍奇金淋巴瘤(NHL)患者轉向後期治療可能出現的特徵以及觸發因素。該公司希望更好地瞭解該疾病的臨床進展以及在患者病程的每個階段最為適合的治療方式。
從該公司的案例中,我們提取出將機器學習技術用於醫學領域研究專案的三項關鍵指導原則,以幫助其他藥物研發公司或者醫療研究機構搭建高質量的醫學 AI 專案。
1、吸引到精準的利益相關者,才能產生有意義的假設以及獲得來自組織的支援。
雖然很多時候,我們懷著滿腔熱情直接衝向資料並開始分析。但在此之前,更為關鍵的第一步是列出必須回答的關鍵業務問題並提出假設。構建一張完整的、可操作的假設列表,將幫助分析團隊明確測試和證明或者反駁假設所需的資料型別。
重要的是要了解整個企業職能團隊的關鍵利益相關者的觀點,以確保假設包含正確的專業知識併為公司提供最高價值。這也有助於建立對分析的支援和信任。
在這種情況下,製藥公司將其品牌、醫療和商業情報小組人員引入團隊。當患者必須從一種療法轉移到另一種療法時,為其可能發生的狀況作出假設,同時分析這些轉變背後的的觸發因素。
例如,在試圖推測疾病進展快速或緩慢的原因時,醫療團隊對疾病的臨床瞭解做出貢獻,品牌團隊則提供公司相關治療產品的方案的解讀以及醫生如何使用它們,以及商業智慧團隊解釋方案所使用的分析方法和資料集,還有目前業界對於該疾病的治療和疾病課程的理解。
2、最佳資料集可能是資料集的組合。
確定一個廣泛且豐富的資料集對於正確訓練機器學習演算法至關重要。在腫瘤學中尤其如此,在很長的歷史時間內收集到許多患者,需要大量的變數集合,才能夠以進行有效的分析。這其中包括年齡,性別,診斷史,藥物和治療史,實驗室價值觀和醫院遭遇。
在我們的合作案例中,製藥公司的分析小組意識到其內部資料沒有捕獲到足以預測患者轉變的變數。因此,該小組採用了一種策略,在該策略中,它使用內部和外部資料,將腫瘤學特定的,整合的,結構化的 EHR 資料集與一些已經重複實驗得到驗證的公開資料進行融合。
所有資料都被拼接在一起並送入自動功能發現(AFD)機器學習引擎。該引擎能夠在數小時內測試數百萬個假設。該引擎探索了患者資料每個可能的變化,以檢視是否有任何變數與向後期治療效果具有統計學上的顯著相關性。
從主題專家那裡收集的見解有助於確保 AFD 結果具有臨床相關性。例如,當結果表明升高的肝功能標誌物與疾病進展相關,並且得到了醫務人員的證實。雖然這不是他們之前考慮的因素,但在臨床上是可能的。
3、反饋迴圈和多次驗證是獲得良好結果的關鍵。
往復多次的測試和學習過程對於開發精確模型至關重要。該製藥公司的分析小組測試了 200 多項實驗室資料值,主要覆蓋慢性併發症和病史。機器學習有助於識別和篩選出引發病變的關鍵變數組合。
驗證和改進模型將能夠避免無關變數的干擾,以及減少變數的數量。
經過數週的迭代學習和驗證,我們成功開發了一個模型來預測從初始診斷到後期治療的進展。具體而言,機器學習能夠從患者的治療過程,實驗室資料和用藥病歷中提取出特徵值和觸發因素,並且經過驗證的特徵值可用於對患者發生病變的概率和各種可能性進行評分和排名。
這些模型揭示了許多重要的見解,包括:
*選擇實驗室結果的異常,例如升高的肝功能指標,在某些情況下,可能預示著患者的病情惡化或轉移到一下階段,其可能性高達 140%。
通過應用正確的資料,組織流程和臨床知識,機器學習和人工智慧可以在製藥和醫療保健方面發揮重要作用。儘管現在看來仍存在一些侷限性。例如,它可能很難解釋一些複雜的模型所能得出的結論,並且標記最飢餓的模型所需的大量資料集可能是非常費力的。
然而,目前這些限制正在得到解決,比如,LIME(Local Interpretable Model-agnostic Explanations,區域性可解釋模型的不可知解釋,用來理解複雜機器模型做出決策的方法的一項工具。)等技術有助於顯示模型推理。與此同時,我們也在努力使用機器學習本身來標記資料集。
隨著限制的開放,製藥和醫療保健的機會將大大增加。那些已經開始利用機器學習的公司將擁有利用機器學習創造更為為先進的基礎設施和流程。