BDTC:大資料與人工智慧的結合將越發緊密
隨著近年來在算力、演算法的突破,人工智慧爆發出強烈的能量,此外,通過大資料讓人工智慧獲得成長基礎,再利用人工智慧分析大資料,大資料與人工智慧結合的越發緊密,而大資料正在從貯藏的石油成為流動的石油,資料的價值正在逐步體現出來。大資料與人工智慧正在改變著商業生態與行業形態,在社會充斥於數字化轉型時,大資料是其中的關鍵之一。
近日,由中國計算機學會主辦,CCF大資料專家委員會承辦,CSDN、中科天璣資料科技股份有限公司協辦的2018 中國大資料技術大會(BDTC)在北京舉辦,作為舉辦的第12屆大資料技術大會,本次大會也結合了當前企業轉型需求,聚焦於資料新應用。
中國科學院院士北京理工大學常務副校長CCF大資料專家委員會主任梅巨集院士表示,作為國內具有影響力的技術盛會,大資料技術大會需要與時俱進的結合經濟轉型發展的重要趨勢,深入具體應用,因為大資料已經成為重要的基礎資源。
大資料應用也在發生變化
從大資料提出以後,隨著技術的不斷成熟,大資料應用一直面臨著新的變化,大資料技術大會《2019年大資料發展趨勢預測報告》提出的十個具體預測如下:
1. 資料科學與人工智慧的結合越來也緊密。
2. 機器學習繼續成為大資料智慧分析的核心技術。
3. 大資料的安全和隱私保護成為研究和應用熱點。
4. 資料科學帶動多學科融合;基礎理論研究受到重視,但未見突破。
5. 基於知識圖譜的大資料應用成為熱門應用場景。
6. 資料的語義化和知識化是資料價值的基礎問題。
7. 人工智慧、大資料、雲端計算將高度融合為一體化的系統。
8. 基於區塊鏈技術的大資料應用場景漸漸豐富。
9. 大資料處理多樣化模式並存融合,基於海量知識仍是主流智慧模式。
10.關鍵資料資源涉及國家主權。
通過以上預測,我們可以瞭解到,人工智慧熱度有增無減,相對應的由資料科學所形成的突破,並沒有達到相應預期,發展緩慢。此外,資料安全問題頻發,未來資料安全與隱私保護以及資料所有權將會逐步引起重視。
CCF大資料專家委員會副祕書長、北京永信至誠科技股份有限公司高階副總裁潘柱廷表示,從2013年到2019年,大資料正在經歷了重要的轉變,從早期的“概念”逐步走向“價值”,在此過程中,大資料與雲端計算、移動網際網路、IoT等也在深度融合,併產生更大價值,此外,大資料與人工智慧的應用,就如同雲端計算越來越成為基礎應用的一部分。
依據報告,大資料應用層面將出現新的變化,具體而言,健康醫療、智慧城市、金融依然是大資料最為重要的行業應用,而早期排名榜首的電子商務出現下滑,位居第四位。另外,城市資料、視訊資料與語言資料的增長將會因為大資料應用而取得突破。
優質的資料是推動了人工智慧浪潮的條件之一
從之前的報告中,我們不難看出,人工智慧相關預測佔據十分之三的份額,這也意味著人工智慧依然將充滿機遇,當然其中也包含風險與挑戰。原始碼資本投資合夥人張巨集江博士表示,雖然人工智慧來勢迅猛,但其中也會遇到許多問題,這就需要明辨當前人工智慧發展的重要原因。
回看人工智慧發展史,在此之前人工智慧實際上已經經歷了兩次浪潮,第一次由人工智慧概念的提出而引發,第二次來源於神經網路與深度學習演算法的進步,而本次人工智慧浪潮的爆發始於深度學習演算法的改良和突破,而這其中大資料的作用也十分明顯。
由網際網路的快速發展,引發了資料量的爆炸式增長,而大量的資料將為深度學習提供重要的資料學習來源,在演算法改進的情況下,計算力的提高,計算量隨之增長,會有效的降低了人工智慧的誤差率,由此可知,算力、演算法、資料缺一不可。從另一個角度,未嘗不能說明,本次人工智慧成長的浪潮與之前兩次有著極大的不同。
優質的資料能夠成為人工智慧的沃土,而有資料表明,每分鐘頭條將超過300萬用戶在使用,同一時間微信中將會產生2600萬朋友圈資訊,在美團的訂單量會超過七千個,而這些資料可以描述人的行為、商品的流通、消費的情況等等一系列資料都是高質量資料的來源基礎。
以影象識別為例,張巨集江表示,國內最好的人臉識別公司,在影象樣本學習的量級上已經達到了以億為單位,作為有著優良的計算力、優質的演算法開發團隊,以及大量的影象樣張的年輕公司,已經讓影象識別的能力遠超人們的想象,而未來將難以預料。
大資料在人工智慧的成長中扮演著重要的角色,以資料為核心,在演算法與算力的支撐下,人工智慧正在成為一種新的方法,通過與行業應用相結合,可以為人類提供更多的應用工具,將人們從繁重重複的勞動中解脫出來。