人工智慧這個詞,很壞
不知道誰這麼壞,給起了一個人工智慧這個詞,讓通過科幻片才瞭解啥叫智慧的普羅大眾老誤解人工智慧,就像現在我仍然對智慧手機這個詞有微言,這怎麼就智慧了呢?從現在表現出來的人工智慧規模應用來說,本質上就是個概率統計的事,和智慧根本不沾邊,倒是和人工挺沾邊,需要人工做大量的資料標準化加工、資料標註,再餵給演算法。所以,有必要理解人工智慧需要啥基礎、人工智慧為啥火了、人工智慧能幹啥。
(1)主航道
20年前,我來北京的時候帶了六本書:Windows核心程式設計、TCP/IP協議第一卷、資料庫原理、CORBA系統結構(2000年在北京買的)、人工智慧專家系統、Delphi高階開發指南。這六本書基本把從作業系統層到網路層,從資料層到邏輯層到UI層全都涵蓋。
20年後,2018年,我提出了技術下半場:UI人機互動靠人工智慧視覺識別/語音互動、感測器/IOT萬物物聯,邏輯處理靠人工智慧關聯推薦演算法,資料靠區塊鏈來整合各方資料來源,算力靠雲端計算(量子計算還談不上)。我們各種應用應該在這樣一個基礎技術環境下來重新考慮使用者的問題、使用者的應用場景、使用者的應用設計。
20年前,我和同寢室的舍友講:未來是你要找的正在找你,未來手機就是能移動的電腦,未來汽車也是能移動的電腦。說這話,已經過去了快20年。這三個都是極其高的門檻。
未來是你要找的正在找你,這裡面涉及三個問題:你是誰,你在哪兒,怎麼觸達你。你是誰,在今天來說,就是使用者主資料、就是統一ID、就是畫像標籤、還包括你的關係網路;所謂統一ID,就是唯一識別你,如你的身份證號、你的手機號/郵箱地址、你的裝置MAC號和cookies、你的社交網路賬號如微信/QQ/微博、你的交易支付賬號如支付寶,當然也包括你這張臉;你在哪兒,所以各種定位你的方式都有用,如GPS、4G、WIFI、人臉識別(車牌識別)都是關鍵需要。怎麼觸達你,所以各種通訊通達也很有價值,如簡訊/電話、郵件、IM、移動app訊息/手機通知中心、智慧助手/智慧音箱。
未來手機就是能移動的電腦,目前已經實現。產生了諸多巨頭公司,如在晶片層面的ARM和高通,作業系統層面的iOS和Android、手機層面的iPhone和小米。應用層面更是百花齊放,有語音訊息之於微信、GPS之於滴滴、攝像頭AI美顏之於直播抖音。
未來汽車也是能移動的電腦,這個目前正在如火如荼之中。Google先鋪墊了十年,在很多基礎技術方面積累很深。2017年開始,百度人工智慧方面的科技人才紛紛離職百度創業,不少人投身的方面就是新能源無人駕駛汽車產業鏈。新能源動力引擎簡化了不少汽車的研發設計、零部件、製造工藝、成本,直接跳過了傳統汽車最複雜最核心的內燃機和變速箱,這為網際網路企業造車提供了基礎條件,但電池又成為了新的核心技術。車輛控制方面需要的晶片和OS,環境感知方面需要的感測器和攝像頭,路徑規劃方面需要的GPS和地圖,這條產業鏈很長。網際網路造車是個必經的階段,來自易車網和易鑫汽車金融的李斌的蔚來汽車、來自汽車之家的李想的車和家、來自UC創始團隊的何小鵬的小鵬汽車、還有大家說的“大忽悠”賈躍亭的FF汽車,只有這些來自網際網路的人,才能把未來汽車造成移動電腦的本質。
我之所以在這篇文章開首這麼談,主要想告訴大家:未來人工智慧技術的應用主航道在哪裡。
(2)人工智慧基石完備了
人工智慧三大關鍵基礎基石:演算法、算力、資料。
人工智慧三大技術領域:視覺識別、語音互動、自然語言處理。
人工智慧這個技術領域,已經六十年了,主要在演算法層面在鑽研。但缺乏算力和資料,所以演算法的優化一直很慢。
2016年,人工智慧熱潮再次引爆,為啥引爆?這是因為Google做了四件大事:
1、演算法:簡化了多層深度神經網路演算法,讓演算法複雜度大大降低一個等級,讓算力需求量縮小,讓資料需求量縮小,便於在算力、資料儲存都很受限的移動裝置、物聯裝置環境內使用。因為移動裝置、物聯裝置是未來主要的應用場景
2、算力:於2016年釋出了專門AI運算的TPU晶片,專門為AI運算優化
3、工具:於2016年開源了Tensorflow最初始版本,把演算法內建在程式碼工具裡,可以讓普通公司也能使用AI技術
4、應用:於2016年釋出了AlhpaGo,並全世界挑戰圍棋大師,數戰成名。想起上世紀90年代人工智慧熱的時候,也是IBM的深藍伺服器搞了國際象棋應用挑戰了全球國際象棋大師一戰成名。
至於資料嘛:
1、資料產生:人手一部的智慧移動手機、智慧裝置OS、攝像頭/麥克風/感測器,讓多媒體資料(語音/照片/視訊)產生數量級的爆炸;
2、資料傳輸:4G5G有利於資料隨時隨地高速傳輸頻寬
3、資料儲存:NOSQL有利於各種資料擴充套件儲存;
4、資料計算力:以Spark為代表的大資料技術平臺有利於海量資料處理;
這些基礎技術的大規模商用,讓資料產生、採集、傳輸、儲存、計算,提供了完整的基礎支撐。所以這次人工智慧又再次活了過來。
現在,在計算世界:IOT端-邊緣端-管端-雲端,人工智慧需要的:算力、演算法、資料三大核心要素,全都具備了。
而中國人喜歡做的,是解決方案,從晶片/處理伺服器(雲端計算),到軟(AI處理引擎)硬體(商用攝像頭/語音互動音箱)具體應用,到行業場景,一攬子。這是中國的特點,只有這樣在中國才能掙錢、中國客戶才買單。
(3)過去:自然語言處理
其實在2016年AlphaGo火爆、人工智慧創業熱和VC投資熱之前,人工智慧已經被廣泛應用了,只不過我們那時候不把他們當做人工智慧這麼酷的詞來看待。
那就是自然語言處理這一大人工智慧分支,它崛起於文字內容網際網路時代。演算法用的最多就是分類聚類。
在文字內容生產方面,如何做到熱點選題,如何做到智慧起標題黨可以提高文章開啟率,如何智慧提取關鍵內容讓讀者很快抓住重點,如何內容結構化讓文章更思路清晰,如何快速且精準地稽核防範內容風險,如何給內容自動分類、智慧打標籤,這都得益於自然語言處理技術。
在文字內容消費方面,應用最廣的就是:精準搜尋、關聯推薦。Google和百度的精準搜尋、關聯廣告,淘寶京東的商品關聯推薦、千人千面商品展示,今日頭條的關聯推薦、滴滴的人車物流最佳匹配排程、菜鳥網路的車貨物流最佳匹配排程,皆是此技術的代表應用。輿情監控與自動處理也算這個範疇。
在文字內容互動方面,如今所謂流行的文字智慧互動機器人(IM),其實也是這個技術的價值應用,省卻了很多售前售後接待的工作量。
自然語言處理技術通過分類聚類演算法,還能實現一個非常有價值的應用,那就是關聯圖譜。人和人之間的關係圖譜、企業和企業之間的關係圖譜、商品之間的關係圖譜、人和企業之間的關係圖譜、人和商品之間的關係圖譜。這給精準營銷、交易轉化帶來了很高的價值。
自然語言處理技術最成熟,開源的引擎也很多,我們只要在自己的行業的各個場景充分應用它,就能發揮巨大價值。我現在在各行各業的企業資訊化領域也很少看到應用自然語言處理技術的,大多數企業資訊化都以業務流程處理為重心,不以資料處理為重心。
再著重重複講一句話:咱們都是技術的先驅者。咱們認為一場技術大戰已經格局已定沒什麼機會了,其實在廣袤的中國各行各業,它的應用機會才剛剛規模化來臨。
(4)現在:視覺識別
人工智慧目前火爆並實用的第一波應用就是:視覺識別。更確切地講,應該是人臉識別。
為啥視覺識別這麼寬的領域,獨獨是人臉識別應用先崛起?無他,智慧手機高清攝像頭普及後,自拍人臉資料量增多了,美顏萌照應用需求也在拉動,所以才會被規模性引爆。
一、視覺識別在數字內容方面的應用
1、美顏、萌照
2、媒體:內容審查與內容處理。想起小編為了波叔處理了三天三夜就覺得這視覺識別價值真高
3、醫療:影像對比識別
4、教育:線上教育題庫拍照識別搜題
二、人臉識別在社會基礎設施方面的應用
人臉識別首先在安全要求高的場景中被廣泛應用:如雪亮工程城市安防、公檢法、社保民政(不知道你給你爸爸媽媽在手機App上做過養老金續領的人臉認證不);如交通要塞(機場/火車站/地鐵);如和錢交易支付有密切關係的金融(不知道你體驗過眨眨眼睛或動動嘴搖搖頭的人臉識別支付不 )。
三、人臉識別線上下營銷方面的應用
媒體行業是內容吸引使用者流量,靠營銷廣告變現。現線上下廣告,如電臺電視臺、戶外路牌、樓宇海報、報紙雜誌,都做不到流量統計、使用者識別、使用者行為跟蹤,這為他們的廣告業務增長帶來了阻力。戶外路牌、樓宇海報首先進行了自我革命,加裝了攝像頭,加入了人臉識別技術,各個廣告被多少人看了,人們看的行為反應是什麼,這些人都是些什麼特徵的人,全都知道。
四、人臉識別線上下零售方面的應用
亞馬遜的Amazon Go智慧無人零售商店,頂棚安滿了攝像頭進行商品識別、消費者人臉識別、消費者購物路徑的跟蹤、消費者購物行為跟蹤。只有這樣做,才能做到和線上同樣的功效。因為在在線上很容易很低成本做到的使用者流量統計、使用者識別、使用者行為跟蹤,線上下需要很複雜的技術才能做到。電子商務就是得益於使用者流量統計、使用者識別、使用者行為跟蹤這三大基礎應用,所以能比線下零售做到更優秀的智慧廣告投放流量吸引、智慧選品、智慧陳列、智慧關聯推薦、智慧定價、智慧促銷活動、智慧實時優惠券,而線下零售就是受制於這些線下技術達不到線上的效果,所以線下的零售轉化率不高。
(5)未來:語音互動
我最早應用語音合成(文字轉語音)是在做企業資訊化的時候,主要的應用場景是:醫院門診藥房叫號讓患者來視窗取藥、客服中心自動語音導航播報。所以現在只要使用語音播報的地方,都大量採用了人工智慧語音合成,不需要人工。
現在最火的是語音-語音識別,在教育領域實用性最強,如口語測驗與矯正,如音樂彈奏(演唱)測驗與矯正。所以作為中國語音技術第一股科大訊飛,主要就扎堆在教育應用領域。現在火熱的智慧音箱、兒童陪伴機器人創業,其實利用的也都是這個技術。
語音技術什麼時候可以賺大錢,可能真的需要等網際網路造車成熟。在車上,手、腳、眼睛都在忙碌,只有語音可以解放出來。
記住,沒有消費級的應用出現,技術無處安放。