從矽谷一線VC投資版圖,看AI+新藥研發的挑戰與前景
編者按:本文來自 ofollow,noindex">“矽谷密探” (ID:guigudiyixian),36氪經授權轉載。
《我不是藥神》在今夏的火爆,恐怕反應出了很多人的心聲:看病已然不易,買藥更加艱難。
為什麼藥價這麼貴?
新藥研發成本非常高,就是其中一個重要原因。業內有種說法,新藥研究需要 “兩個十”:用十年,花十億美金。如果再把失敗嘗試的成本也算進去,每種藥物研發費用更是達到 27 億美元。
但就算花了這 “兩個十”,也無法保證研發一定成功 —— 藥物研發的成功率並不高。《自然》雜誌撰文稱,從臨床 I 期到獲得審批的這段時間裡,高達 90% 的專案以失敗告終。
高投入、高風險,往往伴隨著高回報。一旦新藥過關斬將、成功上市,經濟回報往往相當驚人,這也是資本、特別是矽谷一些諸如 Andreessen Horowitz、Khosla Ventures 等頂級 VC 比較青睞醫藥的原因。比如輝瑞製藥旗下受專利保護的降血脂藥物立普妥(Lipitor),僅 2010 年一年的全球銷售額,就高達 107.33 億美元,在輝瑞當年所有藥品裡取得最高營收,而當年廣為人知的輝瑞小藍片 “偉哥” 僅以 19.28 的營收屈居第六。看來降血脂和重振雄風相比,前者才是更剛的剛需。
可以說,巨大的經濟回報既是藥企研發新藥的動力、也是新藥價格昂貴的原因,更是有些市場小、規模有限的罕見病無藥可醫的部分原因。
新藥研究道阻且長,因此,許多大型藥廠和科研機構都在找用 AI 來提高效率、提高成功率的辦法。與 AI和醫療結合的其他領域比,新藥研發領域雖然潛力巨大,但也面臨不少挑戰。
在討論AI如何加速新藥研發之前,我們先來看看一款藥是如何 “誕生” 的。
新藥開發,萬里挑一
一款藥到底安不安全?有沒有效?如何確定劑量?新藥研發的所有流程和步驟,其實就是為了回答這三個問題。
以常見的小分子化合物藥(比如青黴素)為例,新藥開發可以分為:臨床前研究、臨床研究,藥物批准上市及上市後監測這三個大步驟。
(圖自矽谷密探,版權屬於原作者)
用大白話說,“臨床前研究” 階段,就是尋找藥裡可以治病的化合物的階段。具體可以細分為藥物靶點確認、化合物合成、活性化合物的篩選、選定先導化合物、評估藥物的藥理作用、製劑開發等階段。在這些小步驟中,藥物靶點確認是一切後續工作的基礎,而從 “化合物合成” 到 “選定先導化合物”,為了找到安全、有效的化合物,往往需要反覆很多次。
這個階段也是化合物的 “海選” 階段,最開始的大幾千、甚至 10000 個化合物,經過層層篩選和驗證後,只有 5 ~ 10 個化合物可以進入臨床試驗階段。
在臨床研究階段,還要進一步分為 I 期、II 期、III 期臨床試驗。如果說 “臨床前研究” 階段,基本回答了安不安全、有沒有效的問題,這個階段則要證明發生在人身上的實際結果,和理論結果是相吻合的。同時,劑量多少也在此階段確定。
在臨床 III 期,不僅試用藥物的志願者人數更多,同時也是治療作用的確認階段。接下來藥品註冊申請能否獲得批准,臨床 III 期提供的依據往往是關鍵。
如果在新聞裡看到某款新藥已經在 III 期臨床階段,往往意味著該款新藥上架可期。不過如果臨床研究階段裡的任何一個小階段效果不好、或者不如市場上現有藥物好,那款新藥往往會胎死腹中。2017 年,美國 FDA 一共只批准了 46 款新藥,可見批准難度之高。
經過臨床研究洗禮後,依然被認為有效的最後一種化合物,在獲得相關部門批准後,才會上市變成一款新藥。上市後的後續監測,則要確保該款新藥首次被大範圍人群應用後的療效,此外還要進行不良反應的監測。我們看到藥物說明書裡的增補、禁忌,和不良反應(比如:大多數人吃了這個藥會怎樣怎樣,少數會有某種反應,如發生某種情況則需要就醫),就是這一步的體現。
至少十年、至少十億美元,萬里挑一,才可能有一種新藥。而目前的 AI 技術,則主要集中於解決“新候選藥物的生成(generate novel drug candidates)” 這個問題。
新候選藥物的生成:最受資本青睞
過去十幾年大資料集的可用性和先進演算法的發展,推動了機器學習的重大改進,這使得實現狹義 AI 成為可能。“狹義 AI” 指的就是專注於特定任務、特定場景的 AI。換句話說,目前的 AI 只有在醫療、車載等特定場景下,才能努力像人一樣思考。
想要思考,總得先聽懂人家在講什麼吧!近兩年很火熱的自然語言處理(Natural Language Processing),指的就是機器能夠用和我們人類相似的方式理解文字、找出規律,明白一個東西在講什麼。這種技術在計算機視覺(computer vision)、語音分析和路線選擇領域已經得到了廣泛應用。
藥物研發領域也不例外。一方面,AI 具有 “從大量資料中找出隱藏的規律和線索” 的能力,另一方面,藥物研發恰恰需要處理大量資料文獻、進行大量試錯,讓新藥研發耗時耗力耗錢。兩者正好契合,也就不難理解為什麼近幾年 “AI+藥物研發” 的初創公司大量出現。
以 Crunchbase 上的資料為準,小探整理的 115 家 AI+新藥研發領域的公司裡,有 40% 成立於 2014 到 2017 年間。
(圖自矽谷密探,版權屬於原作者)
那麼,這些公司都是做什麼的呢?
根據科技部落格 BenchSci 的一篇文章,按照一款新藥從一個靈感變成商品,我們按照流程,可以把這些公司分成以下十二大類:
其中,在 “產生新的候選藥物(generate novel drug candidates)” 這個小領域的初創公司數量佔比最大,115 家裡足足佔了 36 家:
(圖自矽谷密探,版權屬於原作者)
雖然藥物研發成功率總體不高,但資本對這一類別的初創公司投錢並不手軟:
(圖自矽谷密探,版權屬於原作者)
而在 CB Insights 上列出的 9 家有代表性的 AI+新藥研發創業公司中,已有六家得到了 VC 的資本支援,而且均為矽谷一線 VC。
這其中,Andreessen Horowitz 最近種子投資了 DUMA 藥物發現平臺開發商 twoXAR;
Khosla Ventures 投資的 Atomwise,在去年釋出了埃博拉治療藥物的首批研究結果;
Lightspeed Venture Partners 於 2013 年投資了 Numedii;
Foundation Capital 參與了 Numerate 的三輪股權融資。
因此,這個小領域的拔尖者,也可以被看做是整個 AI+新藥研發的領頭羊。
AI 新藥研發:創業公司打頭陣,老牌藥廠擇優合作
AI 的出現,或許能加快找尋 “解藥” 的步伐。
舉個例子:前兩年流行的 “冰桶挑戰” 讓很多人第一次聽說了 “漸凍症” 這種疾病。漸凍症的全名叫肌萎縮側索硬化症,英文縮寫是 ALS,很長時間來人們對它幾乎束手無策。
總部位於倫敦的初創公司 BenevolentAI 擁有自己的人工智慧平臺,平臺上的資料來自學術論文、專利、臨床試驗和患者們的醫療記錄。這麼多資料第一次匯聚到一個地方,就使得研究人員有可能發現各種生物實體之間 —— 生物實體就是症狀、基因、疾病、蛋白質、候選藥物等—— 直接有、或可能有的關係。更妙的是,這個系統還可以像谷歌或者百度一樣,讓研究人員用搜索引擎的方式查詢資料,比如研究人員可以找某種疾病和某種基因之間的關係。
當 BenevolentAI 問系統有沒有治療漸凍症可能的藥物時,系統就能找出 100 種現有的、有望治癒漸凍症的化合物,為研究人員極大地縮小了研究範圍。研究人員可以在這 100 種化合物中進一步篩選出 5 種最有希望的化合物,而不用從 5000 ~ 10000 種化合物篩起。
今年,BenevolentAI 獲強生公司旗下 Janssen Pharmaceutical 投資,這也使得前者成為 AI+新藥研發領域獲得投資最多的初創公司。21 億美元的估值,也讓它順利擠進了獨角獸俱樂部。
總部在美國猶他州鹽湖城的初創公司 Recursion Pharmaceuticals(以下簡稱 Recursion),則用 AI 在數百種細胞疾病模型上並行測試數千種化合物,以大規模同時進行多種實驗。舊藥說不定有新用途,而 Recursion 在做的事情就是在儘可能短的時間內,找到這些新用途。
2016年,創立僅僅三年後,Recursion 宣佈與製藥巨頭賽諾菲合作,幫助後者確定一些已經進行到臨床階段的分子在幾十種遺傳疾病中可能的新用途。此外,賽諾菲也與英國初創企業 Exscientia 簽署了合作協議,計劃使用後者的 AI 平臺尋找代謝疾病治療。
來自矽谷的 Atomwise,則運用超級計算機、AI和複雜的演算法模擬製藥過程,來預測新藥品的效果,同時降低研發成本。與它合作的,則是老牌醫藥巨頭默克藥廠(Merck)。
隨著 AI 在生物醫藥領域的興起,傳統制藥公司近一年來,紛紛給主攻新藥研發的 AI 創業公司丟擲了橄欖枝:
葛蘭素史克(GlaxoSmithKline)與主攻與年齡相關疾病的 Insilico Medicine 合作;
安進(Amgen)和解決醫療過程中資料共享問題的初創公司 Owkin 合作;
安斯泰來(Astellas)則比較關注重新利用現有化合物。2015年12月,安斯泰來和初創公司 Biovista 宣佈合作,主攻藥物再利用。略微尷尬的是,僅僅一個月後,安斯泰來又和另一家初創公司 NuMedii 宣佈合作,做同樣的事情。
隨著這些製藥巨頭逐漸嘗試在新藥設計環節用 AI 提速,這樣的 “大藥廠+AI 新藥研發創業公司” 的組合比比皆是。其實這種組合也很合理:大藥廠資金再充足,也無法有足夠的時間和資金同時進行多項研發。初創公司具有更大的靈活度、也更能找準問題,但需要資金支援研究的進行。這麼看來,大藥廠和初創公司的拍檔,也就很好理解了。
大藥廠的 “五指山”
作為初創公司,能和大藥廠合作當然值得慶幸,但這個領域裡的初創公司們也有自己的煩惱。
關於初創公司所面臨的挑戰,小探採訪了在美國醫療領域有豐富投資經驗的投資人、Fusion Fund 創始合夥人張璐。
張璐認為,製藥行業本身的行業特點,決定了大牌藥廠享有更大的話語權,在這種環境下的初創公司們,到底如何增加自身實力,有更高自由度,則是不小的挑戰。
張璐進一步總結道,AI+新藥研發領域的初創公司和大藥廠主要有兩種合作方式:
一種是初創公司當大藥廠的 “合同工”,大藥廠給一個專案,初創公司完成即可,按專案收錢。這種方式相對不穩定。
另一種是Saas 模式:初創公司提供軟體,大藥廠用初創公司的軟體分析資料。但我們知道,醫療資料極為敏感,因此很多大藥廠把資料交給作為 “外人” 的初創公司,既不放心也不情願。
在這種情況下,大藥廠往往會提出諸多條件:比如讓初創公司出技術、在藥廠自己的資料庫裡使用,以保證資料的安全;或者要求初創公司只和自己獨家合作、不允許初創公司和自己的競爭對對手合作 —— 當然,大藥廠自己腳跨兩條船是完全沒有問題的,比如上文提到的安斯泰來同時和 Biovista 及 NuMedii 這兩家競爭對手合作。未來,隨著私有云等資料安全相關的技術發展,大藥廠們或許才能更放心地和這些 AI 公司合作。
這並不是說初創公司完全依附於大藥廠,大藥廠也非常需要初創公司的技術,作為自己發展的引擎。這是一個雙方彼此需要,而互相博弈、角力的過程。作為 AI+新藥研發整個行業來講,如何把雙方利益一致化,恐怕還需要探索。
放在 AI+醫療的大領域裡來看,AI+新藥研發還是個非常新的領域。張璐告訴小探,她所在的 Fusion Fund 今年在 AI+醫療領域,比較關注的是醫學成像(medical imaging)和深度學習(deep learning)。與AI+藥物研發相比,後二者發展得更成熟。顯然,這是年輕的 AI+藥物研發領域暫時不具備的。
美國領先,中國發展迅速
如果以國家和地區為單位,來比較各自在 AI+新藥研發領域的發展,可以說是美國領跑、中國發展迅速,而且是亞太地區發展最快的國家。小探統計的 115 家公司裡,美國公司有 56家,佔總數的 48.70%,幾乎近半。
中美兩國各有優勢和劣勢。張璐認為,中國的巨大優勢是資料量很大、且資料獲取成本相對較低。AI 說白了就是以資料訓練機器,資料越多,機器越 “聰明”,因此 AI 在新藥研發領域想有所發展的前提條件,就是有足夠的資料讓 AI 分析。
(張璐今年參加世界經濟論壇討論)
但另一方面,雖然資料量大,但中國有些資料的質量不夠高。
什麼叫資料質量不夠高呢?有兩種情況:一,資料不準確;二,資料沒打標籤。所謂打標籤,就是我們把資料打上標籤後,機器才能夠把資料和意思聯絡起來,從而找出規律,比如把一個帶有氣球圖案的圖片打上 “氣球” 的標籤,機器才知道什麼是氣球。也就是說,沒打標籤的資料是需要進一步加工才能用的,非常不方便。
而美國的優劣勢正好相反:美國醫療資料的資訊化做得相對規範、打標籤也做得比較好,但資料獲取成本也比較高。另外,美國人口也決定了其資料量的上限。此外,美國大藥廠在業內的壟斷規模和極大的話語權,也或多或少影響了初創公司的發展。
看來不論中美,AI+藥物研發這個年輕的領域,還有很長的一段路要走。而對於在這個領域的創業公司來說,如何找準商業模式、獲取更多更高質量的資料、增強資料處理能力,恐怕還將是未來幾年的重點。
本文參考:
From Virtual Nurses To Drug Discovery: 106 Artificial Intelligence Startups In Healthcare
https://www.cbinsights.com/research/artificial-intelligence-startups-healthcare/
How artificial intelligence is changing drug discovery
https://www.nature.com/articles/d41586-018-05267-x
https://blog.benchsci.com/startups-using-artificial-intelligence-in-drug-discovery
https://www.zhihu.com/question/20654032