龍貓資料:服務AI產業,築基智慧生態
說起人工智慧,大部分人不只是耳熟,更能一一列舉出身邊人工智慧應用的例子:人臉識別,智慧家電,語音識別。可如果問到什麼是資料採集和標註,相信除了人工智慧技術從業者外,瞭解這一領域的人真是寥寥無幾,但這阻擋不了資料採集標註在人工智慧行業所扮演的關鍵作用,說資料採集標註是人工智慧行業的發展基石,一點也不為過。
按照目前採用的主流技術模式,人工智慧技術的關鍵在於能夠模進行深度學習,而深度學習的基礎,是以輸入為導向的資料演算法——神經網路,神經網路結果的準確性則取決於接近於“無窮”量級的大資料。所以,進行大量精準的資料訓練,採集海量資料進行標註,是人工智慧進行深度學習極其關鍵的一環。
業內人士介紹,大資料時代的科技分工更加細化,準確高效地對多種型別的資料進行採集、標註、篩選、分類,滿足客戶在機器識別領域進行科研、測試和產品開發等方面的不同需求,就能摒棄複雜的中間環節,大大提升人工智慧深度學習的效率,這也成為人工智慧時代最關鍵的一環。比如在資料標註方面,無論是人物表情標註、人臉多點標註、車輛標註、行進軌跡標註,還是特定符號標註、特殊場景標註、地圖位置標註,完美演算法功能的實現完全取決於資料的精準標註。
那麼,資料標註行業在整個人工智慧領域處於什麼樣的地位,未來又著怎樣的發展前景?龍貓資料的銷售總監謝林波和商務總監羅微波先生在接受媒體訪問時,對上述問題進行了專業的解答。
謝林波認為,資料採集標註和人工智慧之間有著極強的協同增效關係,這個特點已經得到業界的足夠重視,幾乎是業內共識。如何將兩者之間的結界徹底打通?資料採集標註的質量是一個重要的紐帶和基石。人工智慧本身不會識別物體,而要依靠海量的資料訓練。
以人臉識別技術為例,當人臉關鍵點被一一標註之後,計算機才能建立起對人臉的認知。而人臉關鍵點的數目並不固定,不同數目的背後連線的是不同的演算法。資料標註就是把這些資料進行分類、甄別、標註,最終實現更為精準的識別。
謝林波表示,隨著人工智慧產業的發展,資料採集樣本需求量越來越大、樣本分佈越來越廣泛,標註要求越來越嚴格,這對於資料服務商——特別是龍貓資料這種全領域大型服務商,是一個很大的挑戰。依靠自主開發的智慧採集標註平臺,龍貓把資料採集標註需求分發給平臺上百萬量級的眾包使用者,依靠他們閒暇的時間進行資料採集標註,可以快速蒐集大量的資料樣本;資料標註有多重質量把關,保證了資料採集、標註、分類精確無誤。
之前說過,資料標註的質量會直接影響人工智慧訓練的效果,龍貓的資料標註平臺有標註員培訓—標註員考核—標註—稽核——抽審等多重環節,多重把關機制能夠確保最終產出高質量資料;對於複雜的資料需求,龍貓還會通過自己管理的線下團隊進行採集標註。
對於產業的未來發展,龍貓資料的商務總監羅微波表示,人工智慧產業戰略地位不斷提升,無論從國家戰略層面還是行業本身來講,資料服務都是非常重要的一環,從目前的市場規模來看,資料服務行業處於高速增長期,發展潛力巨大,資料服務市場概念持續升溫,資本市場也非常關注。
謝林波表示,隨著資料服務行業市場的不斷成熟,公司業務也不斷拓展,服務能力不斷提升,龍貓資料目前仍在集中精力研發資料的開發採集和標註技術,打造高效穩定的團隊,下一步將持續規範人工智慧資料服務市場,在目前合作的企業領域內拓展更多的跨行業客戶。
據介紹,龍貓資料目前在產品和服務的橫向發展和縱向延伸都做了升級,不僅開放了很多免費資料集服務社會,更創造性搭建出國內首個基於資料的人工智慧綜合服務平臺,可以更大限度的滿足人工智慧企業甚至是傳統行業企業日益增長的定製化資料需求。龍貓資料將持續踐行行業責任和使命,未來會進一步加大在人工智慧資料質量和安全性方面的投入,爭取用最高的價效比,為更多客戶提供精準、安全、迅速的優質資料服務。
“用龍貓的專業,助推中國人工智慧產業的騰飛。”謝林波信心滿滿地說。