人工智慧、機器學習、資料探勘以及資料分析

資料探勘人工智慧資料分析 · 發表 2018-09-27 19:14:30

摘要：人工智慧是目前炙手可熱的一個領域，所有的網際網路公司以及各路大迦們紛紛表態人工智慧將是下一個時代的革命性技術，可與網際網路、移動網際網路時代的變更相媲美；AlphaGo在圍棋領域戰勝人類最頂尖的棋手讓大眾第一次直觀的認識到了人工智慧的威力和強大，於是大家都不禁在思考到底什麼是人工智慧，它將給...

人工智慧是目前炙手可熱的一個領域，所有的網際網路公司以及各路大迦們紛紛表態人工智慧將是下一個時代的革命性技術，可與網際網路、移動網際網路時代的變更相媲美；AlphaGo在圍棋領域戰勝人類最頂尖的棋手讓大眾第一次直觀的認識到了人工智慧的威力和強大，於是大家都不禁在思考到底什麼是人工智慧，它將給人類帶來怎樣的變化和未來?

0.人工智慧

人工智慧英文縮寫為AI，它是研究、開發用於模擬、延伸和擴充套件人的智慧的理論、方法、技術及應用系統的一門新的技術科學。人工智慧是電腦科學研究領域的一個重要分支，又是眾多學科的一個交叉學科，它企圖瞭解智慧的實質，並生產出一種新的能以人類智慧相似的方式做出反應的智慧機器，該領域的研究包括語音識別、影象識別、機器人、自然語言處理、智慧搜尋和專家系統等等，人工智慧可以對人的意識、思維的資訊過程的模擬。人工智慧包括眾多的分支領域，比如大家熟悉的機器學習、自然語言理解和模式識別等。

1.機器學習

機器學習屬於人工智慧研究與應用的一個分支領域。機器學習的研究更加偏向理論性，其目的更偏向於是研究一種為了讓計算機不斷從資料中學習知識，而使機器學習得到的結果不斷接近目標函式的理論。

機器學習，引用卡內基梅隆大學機器學習研究領域的著名教授Tom Mitchell的經典定義：

如果一個程式在使用既有的經驗E(Experience)來執行某類任務T(Task)的過程中被認為是“具備學習能力的”，那麼它一定要展現出：利用現有的經驗E，不斷改善其完成既定任務T的效能(Performance)的特質。

機器學習已經有了十分廣泛的應用，例如：資料探勘、計算機視覺、自然語言處理、生物特徵識別、搜尋引擎、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、戰略遊戲和機器人運用。在我們當下的生活中，語音輸入識別、手寫輸入識別等技術，識別率相比之前若干年的技術識別率提升非常巨大，達到了將近97%以上，大家可以在各自的手機上體驗這些功能，這些技術來自於機器學習技術的應用。

那機器學習與資料探勘的聯絡是什麼呢？

機器學習為資料探勘提供了理論方法，而資料探勘技術是機器學習技術的一個實際應用。逐步開發和應用了若干新的分析方法逐步演變而來形成的；這兩個領域彼此之間交叉滲透，彼此都會利用對方發展起來的技術方法來實現業務目標，資料探勘的概念更廣，機器學習只是資料探勘領域中的一個新興分支與細分領域，只不過基於大資料技術讓其逐漸成為了當下顯學和主流。

2.資料探勘

資料探勘一般是指從大量的資料中通過演算法搜尋隱藏於其中資訊的過程。資料探勘本質上像是機器學習和人工智慧的基礎，它的主要目的是從各種各樣的資料來源中，提取出超集的資訊，然後將這些資訊合併讓你發現你從來沒有想到過的模式和內在關係。這就意味著，資料探勘不是一種用來證明假說的方法，而是用來構建各種各樣的假說的方法。資料探勘不能告訴你這些問題的答案，他只能告訴你，A和B可能存在相關關係，但是它無法告訴你A和B存在什麼相關關係。機器學習是從假設空間H中尋找假設函式g近似目標函式f。資料探勘是從大量的資料中尋找資料相互之間的特性。

資料探勘是基於資料庫系統的資料發現過程，立足與資料分析技術之上，提供給為高階和高階的規律趨勢發現以及預測功能；同時資料量將變得更為龐大，依賴於模式識別等計算機前沿的技術；其還有另外一個名稱為商業智慧(BI, Business Intelligence)，依託於超大型資料庫以及資料倉庫、資料集市等資料庫技術來完成。

主要挖掘方法有: 分類、估計、預測、相關性分組或關聯規則、聚類、複雜資料型別挖掘(Text, Web ,圖形影象，視訊，音訊等)等技術。

3.深度學習

深度學習的概念源於人工神經網路的研究。含多隱層的多層感知器就是一種深度學習結構。深度學習通過組合低層特徵形成更加抽象的高層表示屬性類別或特徵，以發現數據的分散式特徵表示。晦澀難懂的概念，略微有些難以理解，但是在其高冷的背後，卻有深遠的應用場景和未來。

那深度學習和機器學習是什麼關係呢？

深度學習是實現機器學習的一種方式或一條路徑。其動機在於建立、模擬人腦進行分析學習的神經網路，它模仿人腦的機制來解釋資料。比如其按特定的物理距離連線；而深度學習使用獨立的層、連線，還有資料傳播方向，比如最近大火的卷積神經網路是第一個真正多層結構學習演算法，它利用空間相對關係減少引數數目以提高訓練效能，讓機器認知過程逐層進行，逐步抽象，從而大幅度提升識別的準確性和效率。

神經網路是機器學習的一個分支，而深度學習又是神經網路的一個大分支，深度學習的基本結構是深度神經網路。

4.資料分析

資料分析的概念：基於資料庫系統和應用程式，可以直觀的檢視統計分析系統中的資料，從而可以很快得到我們想要的結果；這個就是最基本的資料分析功能，也是我們在資訊化時代了，除了重構業務流程、提升行業效率和降低成本之外的了。另外資料分析更多的是指從歷史資料裡面發現有價值的資訊，從而提高決策的科學性。資料分析更側重於通過分析資料的歷史分佈然後從中得出一些有價值的資訊。還有一個數據分析更重要的功能，就是資料視覺化。

比如說，在財務系統的資訊化中，基於企業的財務系統，我們可以直觀獲取企業現金流量表、資產負債表和利潤表，這些都來自與我們的資料分析技術。資料分析目前常用的軟體是Excel, R, Python等工具。

在對比資料分析和資料探勘時，資料分析則更像是對歷史資料的一個統計分析過程，比如我們可以對歷史資料進行分析後得到一個粗糙的結論，但當我們想要深入探索為什麼會出現這個結論時，就需要進行資料探勘，探索引起這個結論的種種因素，然後建立起結論和因素之間模型，當有因素有新的值出現時，我們就可以利用這個模型去預測可能產生的結論。

因此資料分析更像是資料探勘的一箇中間過程。

5.總結

人工智慧與機器學習、深度學習的關係

嚴格意義上說，人工智慧和機器學習沒有直接關係，只不過是機器學習的方法被大量的應用於解決人工智慧的問題而已。目前機器學習是人工智慧的一種實現方式，也是最重要的實現方式。

深度學習是機器學習比較火的一個方向，其本身是神經網路演算法的衍生，在影象、語音等富媒體的分類和識別上取得了非常好的效果。

資料探勘與機器學習的關係

資料探勘主要利用機器學習界提供的技術來分析海量資料，利用資料庫界提供的技術來管理海量資料。

機器學習是資料探勘的一種重要方法，但機器學習是另一門學科，並不從屬於資料探勘，二者相輔相成。

深度學習、機器學習的發展帶了許多實際的商業應用，讓虛幻的AI逐步落地，進而影響人類社會發展；

深度學習、機器學習以及未來的AI技術，將讓無人駕駛汽車、更好的預防性治療技術、更發達智慧的疾病治療診斷系統、更好的人類生活娛樂輔助推薦系統等，逐步融入人類社會的方方面面。

AI即使是現在，也是未來，不再是一種科幻影像和概念，業界變成了人類社會當下的一種存在，不管人類是否喜歡或者理解，他們都將革命性地改變創造AI的我們人類自身；

在不久的將來，多智時代一定會徹底走入我們的生活，有興趣入行未來前沿產業的朋友，可以收藏 ofollow,noindex" target="_blank"> 多智時代 ，及時獲取人工智慧、大資料、雲端計算和物聯網的前沿資訊和基礎知識，讓我們一起攜手，引領人工智慧的未來！

人工智慧、機器學習、資料探勘以及資料分析

您可能也會喜歡…