Galaxy生信分析平臺-搭建(本地化)
生物資訊分析平臺可以有效的將非生信人員從生信軟體中脫離,只專注於資料的輸入與輸出,不關注資料的具體分析過程
最近看到一篇 ofollow,noindex" target="_blank">視覺化生信分析利器 Galaxy:本地部署 文章,我也比較喜歡shiny這種工具(可以通過網站進行資料分析以及視覺化),這點與Galaxy比較類似,但從平臺角度來說,後者更加專業一點
Galaxy提供了一個執行互動式分析的分析環境,同時確保結果分析具有透明和可重複性。Galaxy框架在其後臺封裝了很多高階的計算工具,並且在網頁的前端給這些工具以直觀的使用介面而把計算和儲存管理的細節隱藏起來。因此,它消除了在執行許多常見型別的大規模分析過程中對專門的資訊學專業知識的需求。正因為如此,使得Galaxy生物資訊分析平臺成為了目前生物醫學研究領域最受歡迎的線上生物資訊分析工具。
從上述可看出Galaxy是一個開源平臺,然後通過生信分析人員不斷以其為基礎拓展分析流程,實現多種生信分析工具的融合
Galaxy已整合了多個分析流程的開源工具,通過其網站即可訪問使用,進入 https://galaxyproject.org/use/ ,在UseGalxy頁面下是官方伺服器,點選The Galaxy Project free public server; biomedical research的Server,即可進入免費公共的Galaxy分析平臺,我選擇NGS:RNA Analysis進入HISAT2分析介面,如下所示:
除了流行的分析軟體,還有一些文字處理工具(勉強適合一些常規需要,畢竟大家的需求都是多樣化的。。。)
除了官方的Galaxy Server外,還有一些團隊/個人基於Galaxy開發的公開分析平臺,可以在上述網站的Public Servers介面下找到,可以通過一些關鍵詞找到你所需要的分析流程,如搜尋proteomics,如下所示:
從中可看出Galaxy可以用於搭建定製化的生信分析平臺,這點就很有意思了,其主要是提供一個平臺框架,而管理員則是需要在這個平臺上新增分析工具即可供他人使用,主要還是開源的。。。
參考官方文件 Get Galaxy ,結合開頭那篇博文,可以在linux系統上搭建一個屬於自己的生信分析平臺了
安裝前先檢查下是否有Python 2.7,一般ubuntu系統都是預設自帶的
先從Git上將最新版Galaxy克隆到本地(現在最新是18.09)
git clone -b release_18.09 https://github.com/galaxyproject/galaxy.git
然後執行,該命令第一次執行會安裝一些配套檔案以及一些Python模組,如果有報錯,一般就是缺少一些系統檔案,缺啥補啥即可
sh run.sh
如果沒有報錯執行完後,說明Galaxy server已經正常在伺服器上運行了,如果想退出的話 Ctrl+C
即可(如果是將Galaxy提交後臺執行,則可以通過kill PID來關閉程式);但是我們不只是希望能在本機登入Galaxy平臺(前提你本機上有瀏覽器),而是想在外部遠端登入或者內網下其他電腦登入這個IP,這是需要對Galaxy的配置檔案做點修改
首先將初始的配置檔案 config/galaxy.yml.sample
創建出一個新的可使用配置檔案 config/galaxy.yml
(之後Galaxy就識別這個檔案中的配置了)
cp config/galaxy.yml.sample config/galaxy.yml
然後將預設的本地IP http: 127.0.0.1:8080
修改為 http: 0.0.0.0:8080
,8080即埠,這樣就允許外部使用者訪問本機的Galaxy server了(這個跟shiny有點類似),在遠端電腦瀏覽器中輸入網址:http://IP:8080/
介面如下所示:
如需安裝一些除了自帶的一個工具外,可以參考 Installing Tools into Galaxy
其實我更好奇如何將自己寫的指令碼/工具在Galaxy中配置上去,在後續嘗試後再整理下
本文出自於 http://www.bioinfo-scrounger.com 轉載請註明出處