最新 | Microsoft釋出視覺化托拉拽機器學習工具
標星★公眾號 愛你們 ♥
作者:Frederic Lardinois
編譯:公眾號海外部
近期原創文章:
♥ 基於無監督學習的期權定價異常檢測(程式碼+資料)
♥ 5種機器學習演算法在預測股價的應用(程式碼+資料)
♥ 深入研讀:利用Twitter情緒去預測股市
♥ Two Sigma用新聞來預測股價走勢,帶你吊打Kaggle
♥ 利用深度學習最新前沿預測股價走勢
♥ 一位資料科學PhD眼中的演算法交易
♥ 基於RNN和LSTM的股市預測方法
♥ 人工智慧『AI』應用演算法交易,7個必踩的坑!
♥ 神經網路在演算法交易上的應用系列(一)
♥ 預測股市 | 如何避免p-Hacking,為什麼你要看漲?
♥ 如何鑑別那些用深度學習預測股價的花哨模型?
♥ 優化強化學習Q-learning演算法進行股市
微軟今天宣佈了三項旨在簡化機器學習過程的新服務。這些工具包括一個新介面主要是用做完全自動化建立模型過程的工具,一個用於構建,訓練和部署模型的無程式碼可視介面,一個為高階使用者託管Jupyter風格的notebook。
剛開始學習機器學習是困難的。即使是最基本的實驗也需要大量的專業知識。所有這些新工具都隱藏了程式碼,為那些希望編寫自己的程式碼的人提供了一個預配置的平臺,從而大大簡化了這個過程。
Azure自動化機器學習工具的新介面使得建立模型變得非常簡單,只需匯入資料集,然後告訴服務要預測哪個值。使用者不需要編寫一行程式碼,而在後端,這個更新的版本現在支援許多新的演算法和優化方法,可以生成更精確的模型。雖然大部分都是自動化的,但微軟強調,這項服務:“供了完全透明的演算法,因此開發人員和資料科學家可以手動重寫和控制這個過程。”
對於那些希望從一開始就擁有更多控制權的人來說,微軟還發布了Azure機器學習服務的預覽版,這款視覺化介面將允許開發人員構建、訓練和部署機器學習模型,而無需接觸任何程式碼。
這個工具,Azure機器學習視覺化介面,看起來很像現有的Azure ML Studio,微軟第一次嘗試構建一個視覺化機器學習工具。實際上,這兩個服務看起來是一樣的。然而,該公司從未真正推廣過這項服務,儘管它似乎一直是開始機器學習的一個非常有用的工具。
微軟表示,這個新版本結合了Azure ML Studio和Azure機器學習服務的優點。實際上,這意味著雖然介面幾乎相同,但Azure機器學習視覺化介面通過執行在Azure機器學習服務之上,並新增服務的安全性、部署和生命週期管理功能,擴充套件了ML Studio的功能。
該服務提供了一個簡單的介面來清理資料,在不同演算法的幫助下訓練模型,評估它們,最後將它們投入生產。
雖然前兩項服務顯然是針對新手的,但Azure機器學習中新的託管notebook顯然是針對更有經驗的機器學習實踐者。這些notebook預裝了對Azure機器學習Python SDK的支援,並在公司描述為“安全,企業就緒的環境”中執行。這個新特性允許開發人員快速上手,而無需使用所有必要的雲資源建立新的開發環境。
附操作流程
地址:
https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-create-portal-experiments
開始使用
導航到你的工作區的左窗格中。 在創作 (預覽版) 部分下選擇自動機器學習。
如果這是你第一次執行任何使用自動化的機器學習試驗,你將看到以下資訊:
否則,你將看到自動機器學習儀表板與所有自動化機器學習試驗,包括那些執行隨 SDK 的概述。 此處可以篩選和按日期瀏覽在執行過程中,試驗名稱,並執行狀態。
建立試驗
選擇建立試驗按鈕以填充以下窗體。
1、輸入試驗名稱。
2、選擇計算的資料事件探查和訓練作業。 在下拉列表中提供了您現有的計算資源的列表。 若要建立新的計算,請執行步驟 3 中的說明。
3、選擇建立新的計算按鈕以開啟下方窗格中,並配置對於此試驗計算上下文。
4、選擇你的資料的儲存帳戶。 公共預覽版僅支援本地檔案上傳和 Azure Blob 儲存帳戶。
5、選擇一個儲存容器。
6、從儲存容器,選擇一個數據檔案或上傳到容器的檔案從本地計算機。
7、使用預覽和配置檔案選項卡進一步配置你的資料對於此試驗。
a. 在預覽選項卡上,指示是否你的資料包含標頭,並選擇特徵 (列) 是用於定型包含每個功能列中切換按鈕。
b. 在配置檔案選項卡,你可以檢視資料配置檔案的功能,以及分發、 型別和摘要統計資訊 (平均值、 中間值、 最大/最小值等) 的每個。
8、選擇培訓作業型別: 分類、 迴歸或預測。
9、選擇目標列。 其想要對預測的列。
10、用於預測:
a. 選擇時間列:此列包含要使用的時間資料。
b.選擇預測時間範圍:指示多少個時間單位 (分鐘/小時/天/周/月/年) 將該模型能夠預測到將來的發展。 隨著模型需要不太準確它將成為未來的預測。
11、(可選)高階設定: 可用於更好地控制訓練作業的其他設定。
資料事件探查
跨您的資料集以驗證您的資料集是否是機器學習準備就緒,可以獲取各種彙總統計資訊。 對於非數字列,其中包括 min、 max 和錯誤計數等的僅基本統計資訊。 對於數值列,您還可以檢視其統計一點時間,估計分位數。
高階預處理
在配置在實驗時,可以啟用高階的設定Preprocess。 因此,這樣做意味著自動執行以下資料預處理和特徵化步驟。
執行實驗並檢視結果
若要執行此試驗,請單擊開始。 實驗準備過程需要幾分鐘的時間。
檢視實驗詳細資訊
實驗準備階段完成後,你將看到執行詳細資訊螢幕。 這樣,您建立的模型的完整列表。 預設情況下,最高評分的模型基於您的引數列表的頂部。 如訓練作業嘗試出更多的模型,則將它們新增到迭代列表和圖表中。使用迭代圖表以獲取到目前為止生成的模型的快速度量值的比較。
訓練作業可能需要每個管道完成執行一段時間。
檢視訓練執行詳細資訊
向下取的任何輸出模型,以檢視執行詳細資訊,如效能指標等。詳情見下面的連結:
https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-track-experiments#understanding-automated-ml-charts
—End—
量化投資與機器學習微信公眾號,是業內垂直於 Quant 、 MFE 、 CST 等專業的主流自媒體。公眾號擁有來自 公募、私募、券商、銀行、海外 等眾多圈內 10W+ 關注者。每日釋出行業前沿研究成果和最新資訊。