南京航空航天大學開源ALiPy:用於主動學習的Python工具包
-
論文連結:https://arxiv.org/pdf/1901.03802.pdf
-
ALiPy 官網地址:http://parnec.nuaa.edu.cn/huangsj/alipy/index.html
簡介
ALiPy 可為主動學習框架提供基於模組的實現,允許使用者便捷地評估、對比和分析主動學習方法的效能。它可實現超過 20 種演算法,還支援使用者在不同的設定下輕鬆實現自己的方法。
特徵
模型獨立
不限制分類模型的型別。使用者可以按需求在 sklearn 中使用 ofollow,noindex" target="_blank">SVM ,或者在TensorFlow中使用深度模型。
模組獨立
使用者可隨意修改工具包中的一或多個模組,對其他模組不會產生影響。
無需繼承即可實現自己的演算法
對使用者自定義函式限制極少。
支援不同設定
支援 Noisy oracles、Multi-label、Cost effective、Feature querying 等設定。
強大的工具
儲存和載入中間結果、多執行緒、分析實驗結果等。
快速啟動
使用者可以通過以下命令啟動 ALiPy:
pip install alipy
詳細安裝指南,參見 http://parnec.nuaa.edu.cn/huangsj/alipy/installation.html。
-
對於不太熟悉主動學習、 只是想對資料集應用該方法的使用者 ,請檢視 http://parnec.nuaa.edu.cn/huangsj/alipy/page_adv/encapsulation_alexperiment.html,即可使用幾行程式碼執行主動學習流程,無需瞭解任何背景知識。
-
對於 想要對現有主動學習方法進行實驗評估的使用者 ,請檢視 http://parnec.nuaa.edu.cn/huangsj/alipy/alipy_overview.html,瞭解 7 種不同設定下的 20 餘種當前最優演算法。
-
對於 想要實現自己的演算法、執行主動學習實驗的使用者 ,請檢視 http://parnec.nuaa.edu.cn/huangsj/alipy/10_mins_to_alipy.html,學習如何使用 ALiPy 輕鬆實施主動學習實驗。
實現策略
ALiPy 目前提供不同主動學習設定下的多種常見策略,新演算法將會在後續更新中逐步新增。
如上圖所示,ALiPy 提供的 20 多種演算法涉及例項選擇、多標籤資料、特徵查詢等不同設定。ALiPy 官網上還展示了 ALiPy 在例項查詢等設定下的執行機制。如下所示:
例項查詢
Noisy Oracles
不同成本資料集
特徵查詢