演算法工程師的危機

演算法 · 發表 2018-11-20 10:39:05

摘要：作者 | 趙一鳴責編 | 胡巍巍不久前，訊飛AI同傳語音造假的新聞刷爆科技圈，科大訊飛股價應聲下跌3.89% （不是65.3%，標題黨文章害死人）。吃瓜群眾紛紛感慨，有多少人工，就有多少智慧。 AI概念在2015年起就紅得發紫，不論是送外賣，...

作者 | 趙一鳴

責編 | 胡巍巍

不久前，訊飛AI同傳語音造假的新聞刷爆科技圈，科大訊飛股價應聲下跌3.89% （不是65.3%，標題黨文章害死人）。吃瓜群眾紛紛感慨，有多少人工，就有多少智慧。

NIPS會議，人滿為患，改改網路結構，弄個啟用函式就想水一篇paper; 到處都是AI演算法的培訓廣告，三個月，讓你年薪45萬！

在西二旗或望京的地鐵車廂裡打個噴嚏，就能讓10個演算法工程師第二天因為感冒請假。

誰也不知道這波熱潮還能持續多久，但筆者作為一線演算法工程師，已經能明顯感受到危機的味道：以大紅大紫的影象為例，影象方向簡歷堆滿了HR的辦公檯，連小學生都在搞微控制器和計算機視覺。

在筆者所在的公司，人工智慧部門正在從早前研究院性質的組織架構分別向前臺和後臺遷移：前者進入業務部門，背上繁重的KPI，與外部競爭者貼身肉搏。

後者則完全融入基礎架構，像資料庫一樣普通和平凡。之前安逸的偏研究生活被打破， AI早已走下神壇。

以筆者愚見，對於一般的演算法工程師，這種危機包含兩部分：一方面是來自人的競爭，大量便宜的畢業生和培訓生湧入這個行業，人才缺口被迅速填滿甚至飽和，未來的競爭會更激烈。

另一方面則是來自機器的競爭，大量演算法工程師會很快被他們每天研究的演算法所代替。這兩者互相惡化，AI人才市場終會變成一片紅海。

Line"/>

連小學生都會寫模型

工具和框架本身的發展，讓設計模型所需的程式碼寫得越來越簡潔。10年前從頭用C++和矩陣庫實現梯度下降還是有不小的門檻的，動輒上千行。而當今幾十行Keras甚至圖形化的模型構建工具，讓小學生都能設計出可用的二分類模型。

強大的類庫吞噬了知識，掩蓋了內部的複雜性，但也給從業者帶來了不小的惰性。從業者的技術水平，和使用模型的複雜程度關係不大，越是大牛，用的技術更底層更make sense。

不僅如此，深度學習本身的性質，造成了明顯的數學鴻溝。與SVM, 決策樹不同，由於模型存在大量的非線性和複雜的層次關係，且輸入訊號（例如影象，文字）也很複雜，因此嚴格的數學論證是需要極高的抽象技巧的。

該方法為什麼好，在什麼型別的資料上好，有時連作者都在拍腦袋，很多state of arts的方法，成了口口相傳的經驗和trick，而非嚴謹的theory。連batch normlization （批規範化，只包含四個初中數學級別的簡單公式）為何有效，都被爭論了好幾年。

只有鳳毛稜角的專家，能深入到模型最深處，用數值分析和理論證明給出嚴謹的答案。大部分人在入門後便進入漫長的平臺期，美其名曰引數調優，實際就像太上老君煉丹一樣。

我們把這種現象繪製成下面的AI學習曲線，左側是稍顯陡峭的入門期，需要學習基本的矩陣論，微積分和程式設計，之後便是漫長的平臺期。

隨著複雜性越來越高，其學習曲線也越來越陡峭，大部分人也就止步於此。越來越易用的工具，讓曲線的斜率變大，入門期變短，卻並不能改變右側的陡峭程度。

AI學習曲線

入門容易深入難，這條曲線同時也能描述AI人才的收入水平。而真正處於危機的，莫過於夾在中間的芸芸眾人：對理論一知半解，對工具非常依賴。可替代性很強，一旦AI浪潮過去，就知道誰是在裸泳。

市場和業務變化越來越快，能有哪些核心業務，是能讓工程師靜心調個一年半載的呢？

當一個從培訓學校裡出來的人都能做模型時，有多少業務能讓公司多花兩三倍的人力成本，而僅帶來1%的效能提升呢？

機器都能調參，要你幹嗎？

面向大眾AI科普節目，最常討論的便是“AI時代如何不被機器所取代”。很不幸，最容易且最快被取代的反而是演算法工程師。

演算法崗比工程崗更容易被取代。在現有技術下，由於業務需求的複雜性，自動生成一套軟體App或服務幾乎不可能的（否則就已經進入強人工智慧時代了），但模型太容易被形式化地定義了。

根據資料性質，自動生成各個領域的端到端（ end2end ）的模型也逐漸在工業上可用了：影象語音和廣告推薦的飛速發展，直接套用即可。理論和經驗越來越完善，人變得越來越可替代。

特徵可以自動生成和優選，特徵工程師失業了；深度網路採用經典結構即能滿足一般業務需求，引數搜尋在AutoML下變得越來越方便，調參工程師的飯碗也丟了；以前需要大力氣搭建的資料迴流和預測的鏈路，已經成了公司的基礎元件，資料工程師也沒事幹了。

此處引用老闆經常說的一句話： 機器都能幹了，要你幹嗎？

從目前AI熱門論文的情況看，廣告推薦領域已經逐漸成熟，很多技巧沉澱為一整套方法論，已進入平臺期。

下一個即將被攻陷的領域應該是影象；而文字由於其內在的抽象性和模糊性，應該是演算法工程師最後的一塊淨土，但這個門檻，五年內就會有爆發式的突破。

如何最優化職業發展？

人工智慧已經火了至少五年，它在未來五年是否火爆我們不能確定，但一定會更加兩極化：偏基礎的功能一般程式員就能搞定，像白開水一樣普通。而針對更復雜模型甚至強人工智慧的研究會成為少數人的專利。

在一般的技術公司，傳統意義的軟體開發和產品設計，遠比AI演算法的需求來的多。

演算法永遠是錦上添花，而非雪中送炭，再好的演算法也拯救不了落後的業務和商業模式。一旦經濟下行，企業首要幹掉的就是錦上添花且人力成本較高的部分。

如果你是頂級的演算法專家，這樣的問題根本不需擔心。但是，對大部分人來說，如何找到自己的梯度上升方向，實現最優的人生優化器呢？

筆者給出一些不成熟的小建議，供讀者拋磚引玉，基本也是往兩頭走：

首先是深入原理和底層，類似TensorFlow的核心程式碼至少要讀一遍吧？就算沒有嚴格的理論基礎，最起碼也不能瞎搞啊。

切莫不能被工具帶來的易用性迷惑雙眼。要熟悉工具箱裡每種函式的品性，對流動在模型裡的資料有足夠的嗅覺，在調參初期就能對不靠譜的引數快速剪枝。

按個人理解，做演算法帶來的最大收穫是科學精神和實驗思維，這是做工程很難培養出來的。以前看論文看了introduction和模型設計，草草地讀一下實驗結果就完事兒了。

殊不知AB實驗設計很可能才是論文的核心：實驗樣本是否無偏，實驗設計是否嚴謹，核心效果是否合理，是否能證明論文結論。

也許一行程式碼和一個引數的修改，背後是艱辛的思考和實驗，做演算法太需要嚴謹和縝密的思維了。即使未來不做演算法，這些經驗都會是非常寶貴的財富。

再者是儘早面向領域，面向人和業務。AI本身只是工具，它的抽象性並不能讓其成為各個領域的靈丹妙藥。

如果不能和AI專家在深度上競爭，就在業務領域專精深挖，擁有比業務人員更好的資料敏感度，成為跨界專家。現在已經有大量AI+金融、AI+醫療、AI+體育的成功案例。

人能熟悉領域背後的資料，背後的人性，這是機器短時間內無法代替的，跨界帶來的組合爆炸，也許暗含著危機中的機會吧。

最後感慨一下，同樣是80後，年齡相差無幾，有人已是副總裁，有人帶了幾個人的小團隊，有人還在基層苦苦掙扎， 軌跡在畢業時分叉，幾年後早已滄海桑田。

作者簡介：趙一鳴，微信公眾號《沙漠之鷹》，就職於螞蟻金服，從事營銷定價演算法和分散式計算相關工作。

微信改版了，

想快速看到CSDN的熱乎文章，

趕快把CSDN公眾號 設為星標 吧，

開啟公眾號，點選“設為星標”就可以啦！

_“ 徵稿啦 _”

CSDN 公眾號秉持著「與千萬技術人共成長」理念，不僅以「極客頭條」、「暢言」欄目在第一時間以技術人的獨特視角描述技術人關心的行業焦點事件，更有「技術頭條」專欄，深度解讀行業內的熱門技術與場景應用，讓所有的開發者緊跟技術潮流，保持警醒的技術嗅覺，對行業趨勢、技術有更為全面的認知。

如果你有優質的文章，或是行業熱點事件、技術趨勢的真知灼見，或是深度的應用實踐、場景方案等的新見解，歡迎聯絡 CSDN 投稿，聯絡方式：微信（guorui_1118，請備註投稿+姓名+公司職位），郵箱（[email protected]）。