最新 | Microsoft釋出視覺化托拉拽機器學習工具

Azure自動化機器學習工具的新介面使得建立模型變得非常簡單，只需匯入資料集，然後告訴服務要預測哪個值。使用者不需要編寫一行程式碼，而在後端，這個更新的版本現在支援許多新的演算法和優化方法，可以生成更精確的模型。雖然大部分都是自動化的，但微軟強調，這項服務：“供了完全透明的演算法，因此開發人員和資料科學家可以手動重寫和控制這個過程。”

對於那些希望從一開始就擁有更多控制權的人來說，微軟還發布了Azure機器學習服務的預覽版，這款視覺化介面將允許開發人員構建、訓練和部署機器學習模型，而無需接觸任何程式碼。

這個工具，Azure機器學習視覺化介面，看起來很像現有的Azure ML Studio，微軟第一次嘗試構建一個視覺化機器學習工具。實際上，這兩個服務看起來是一樣的。然而，該公司從未真正推廣過這項服務，儘管它似乎一直是開始機器學習的一個非常有用的工具。

微軟表示，這個新版本結合了Azure ML Studio和Azure機器學習服務的優點。實際上，這意味著雖然介面幾乎相同，但Azure機器學習視覺化介面通過執行在Azure機器學習服務之上，並新增服務的安全性、部署和生命週期管理功能，擴充套件了ML Studio的功能。

該服務提供了一個簡單的介面來清理資料，在不同演算法的幫助下訓練模型，評估它們，最後將它們投入生產。

雖然前兩項服務顯然是針對新手的，但Azure機器學習中新的託管notebook顯然是針對更有經驗的機器學習實踐者。這些notebook預裝了對Azure機器學習Python SDK的支援，並在公司描述為“安全，企業就緒的環境”中執行。這個新特性允許開發人員快速上手，而無需使用所有必要的雲資源建立新的開發環境。

附操作流程

地址：

https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-create-portal-experiments

開始使用

導航到你的工作區的左窗格中。在創作（預覽版）部分下選擇自動機器學習。

如果這是你第一次執行任何使用自動化的機器學習試驗，你將看到以下資訊：

否則，你將看到自動機器學習儀表板與所有自動化機器學習試驗，包括那些執行隨 SDK 的概述。此處可以篩選和按日期瀏覽在執行過程中，試驗名稱，並執行狀態。

建立試驗

選擇建立試驗按鈕以填充以下窗體。

1、輸入試驗名稱。

2、選擇計算的資料事件探查和訓練作業。在下拉列表中提供了您現有的計算資源的列表。若要建立新的計算，請執行步驟 3 中的說明。

3、選擇建立新的計算按鈕以開啟下方窗格中，並配置對於此試驗計算上下文。

4、選擇你的資料的儲存帳戶。公共預覽版僅支援本地檔案上傳和 Azure Blob 儲存帳戶。

5、選擇一個儲存容器。

6、從儲存容器，選擇一個數據檔案或上傳到容器的檔案從本地計算機。

7、使用預覽和配置檔案選項卡進一步配置你的資料對於此試驗。

a. 在預覽選項卡上，指示是否你的資料包含標頭，並選擇特徵（列）是用於定型包含每個功能列中切換按鈕。

b. 在配置檔案選項卡，你可以檢視資料配置檔案的功能，以及分發、型別和摘要統計資訊（平均值、中間值、最大/最小值等）的每個。

8、選擇培訓作業型別：分類、迴歸或預測。

9、選擇目標列。其想要對預測的列。

10、用於預測：

a. 選擇時間列：此列包含要使用的時間資料。

b.選擇預測時間範圍：指示多少個時間單位（分鐘/小時/天/周/月/年）將該模型能夠預測到將來的發展。隨著模型需要不太準確它將成為未來的預測。

11、（可選）高階設定：可用於更好地控制訓練作業的其他設定。

資料事件探查

跨您的資料集以驗證您的資料集是否是機器學習準備就緒，可以獲取各種彙總統計資訊。對於非數字列，其中包括 min、 max 和錯誤計數等的僅基本統計資訊。對於數值列，您還可以檢視其統計一點時間，估計分位數。

高階預處理

在配置在實驗時，可以啟用高階的設定Preprocess。因此，這樣做意味著自動執行以下資料預處理和特徵化步驟。

執行實驗並檢視結果

若要執行此試驗，請單擊開始。實驗準備過程需要幾分鐘的時間。

檢視實驗詳細資訊

實驗準備階段完成後，你將看到執行詳細資訊螢幕。這樣，您建立的模型的完整列表。預設情況下，最高評分的模型基於您的引數列表的頂部。如訓練作業嘗試出更多的模型，則將它們新增到迭代列表和圖表中。使用迭代圖表以獲取到目前為止生成的模型的快速度量值的比較。

訓練作業可能需要每個管道完成執行一段時間。

檢視訓練執行詳細資訊

向下取的任何輸出模型，以檢視執行詳細資訊，如效能指標等。詳情見下面的連結：

https://docs.microsoft.com/zh-cn/azure/machine-learning/service/how-to-track-experiments#understanding-automated-ml-charts

—End—

量化投資與機器學習微信公眾號，是業內垂直於 Quant 、 MFE 、 CST 等專業的主流自媒體。公眾號擁有來自 公募、私募、券商、銀行、海外 等眾多圈內 10W+ 關注者。每日釋出行業前沿研究成果和最新資訊。

最新 | Microsoft釋出視覺化托拉拽機器學習工具

♥ 基於無監督學習的期權定價異常檢測（程式碼+資料）

♥ 5種機器學習演算法在預測股價的應用（程式碼+資料）

♥ 深入研讀：利用Twitter情緒去預測股市

♥ Two Sigma用新聞來預測股價走勢，帶你吊打Kaggle

♥ 利用深度學習最新前沿預測股價走勢

♥ 一位資料科學PhD眼中的演算法交易

♥ 基於RNN和LSTM的股市預測方法

♥ 人工智慧『AI』應用演算法交易，7個必踩的坑！

♥ 神經網路在演算法交易上的應用系列（一）

♥ 預測股市 | 如何避免p-Hacking，為什麼你要看漲？

♥ 如何鑑別那些用深度學習預測股價的花哨模型？

♥ 優化強化學習Q-learning演算法進行股市

您可能也會喜歡…