從“傻白甜”到“槓精” AI有了認知智慧萌芽
每個人身體裡都有一個“槓精”:“這可不一定”“我可不這麼認為”“那可說不準”……這些“槓”詞要麼在心裡默唸、要麼在口中碎碎念、要麼大聲講出來,無論是否表達,“槓”的意識出現均是人類獨立思維的表現,所基於的正是人類的綜合分析能力。
如今,人工智慧(AI)也開始“槓”得有條理、有邏輯、有思路起來。日前,在百分點舉辦的無界智慧釋出會現場,IBM大中華區全球資訊科技服務部總經理謝少毅介紹了人工智慧做辯論的專案,“槓精”們大愛的口頭禪出現在了IBM的人工智慧系統 “Project Debater”口中,這背後是機器學習、自然語言處理、海量資料搜尋處理、識別情緒等大量人工智慧技術的應用。
越來越多的人工智慧研究者發明新的技術讓AI向人類“偷師”,一定程度上習得觸類旁通、獨立思考的能力。從“傻白甜”到“槓精”,AI向真實的“人”又貼近了一步,從“感知智慧”慢慢走向“認知智慧”,哪些技術是AI不可或缺的?還有哪些仍待攻堅呢?
從理解語義到“讀心術”,認知智慧初現“你告訴一個AI自己有減肥計劃,AI如果每天建議你吃沙拉,你就會說它不好,不符合心意;如果它天天讓你吃蛋糕,你也會說它不好,不符合減肥需求。”上海紐約大學商學部主任陳宇新教授舉了個連真正的人類都難以把握的兩難抉擇,充分說明理解語義並不一定能夠真正把握要義。
“雖然主人說這是我想要的,但AI做了之後,主人仍會說這不是他想要的……”擁有“認知智慧”的未來AI將充分理解這句堪比繞口令的實質,陳宇新認為,當資料足夠多、演算法足夠強大、模型足夠優秀之後,AI將從理解語義到擁有“讀心術”,分析推測出人類當時可能都不確定的真正想法,在人心裡矛盾時給出“撓到癢處”的答案。
將這個“減肥吃什麼”的難題放大來看,就是對正反的“兩難”進行一系列諸如身體指徵、愛好、時間等多維度的資料綜合分析後,用到大量的人類學、心理學、社會學的內容和方法,通過一系列探索性地問答獲得資料,給出結果。
這種探索性的分析將使AI得到進化,並擁有更廣闊的“職業”選擇。據介紹,美國有公司做出了第一個人工智慧律師ROSS,美國一個律師以往用上百上千個小時做一個案例的分析和調查,現在用了ROSS和人一起合作,時間減少到28分鐘,ROSS,可以提供正反雙方的意見讓律師做決策。
“正反意見的博弈還可以幫高層做決策,可以通過一個機器人提供正反兩面意見的辯論,幫助高層綜合分析做更好的決策。”謝少毅認為,這方面的研究才剛剛開始。進化的AI將被用在更多需要做資訊分析或做決策的領域,例如高階銷售、經濟分析師、企業高階管理人員等。
資料動態融合,AI走進認知智慧的“基石”
從海量資料中“摘出”與當前任務關聯的資料,是AI擁有綜合分析能力的第一步。百分點董事長兼CEO蘇萌表示,AI走進認知智慧首先建立在資料融合的基礎上。
以辯論專案為例,沃森化身的這位“女性”辯手,和另一位人類辯手就“是否應該把體育博彩合法化”的議題展開辯論時,能在聽懂人類長達4分鐘的快速陳述(700—900個單詞)後,進行迅速反應,蒐集資料、選取角度,給出旁徵博引的辯駁;在短兵相接的短辯交鋒中也能很快理解對方的觀點、組織語句並做出有針對性的論述。
蘇萌表示,資料目前來看仍然是人工智慧的基石。不久前,德國商業軟體巨頭SAP以80億美元收購全球最大線上調查公司Qualtrics,說明了資料融合的重要性。2017年,百分點也併購了中國最大的線上調研服務商極速洞察,使得百分點同時擁有高達380萬的中國最大使用者樣本庫,將雙方的行為資料和態度資料進行融合。
資料融合包括擁有海量資料和實現高效融合兩方面。
蘇萌表示,資料融合指的是打破業務系統的煙囪融合海量的多元異構的資料,它既是一次企業內外部資料的融合,也是大小資料的融合,同時也是歷史資料和實時資料的融合,只有資料融合了之後,才能洞見真相避免偏見,才能明智決策避免武斷。
“知識圖譜是我們讓機器去了解、認識人類世界的核心,它把我們的知識構建成網狀的知識結構,再通過人機互動直接輸出。”蘇萌進一步解釋,資料融合意味著知識需要不斷更新,但在更新一個知識點的時候往往需要更新整個知識系統,操作非常繁瑣。
“出版行業或者媒體,甚至公安行業,所涉及的知識都需要實時動態理解,某一個知識不是固定不變的,所以知識圖譜未來的發展方向是動態知識圖譜。” 蘇萌解釋,這個世界由很多的東西構成,比如人、事、地,這些可以理解為本體,本體發生變化或者本體間的關係發生變化後,動態知識圖譜能夠迅速自動重構,高效地實現對一個行業的知識圖譜的構建。
攻堅在路上,來自小資料的挑戰
新的領域、沒有海量樣本、訓練速度不夠,是不是每遇到一個特殊場景,都要重新建模,輸入大量的樣本讓機器重新學習一次呢?條件並不允許。
“很多客戶的實際應用場景是資料量不夠甚至是比較少的,在這種情況下我們結合遷移學習技術,解決了小樣本的模型訓練問題,標註量只有以往的10%。”百分點首席演算法科學家蘇海波說。
從小資料中獲得學習能力,也是人工智慧走向認知智慧的一個重要部分。人工智慧專家經常用貓舉例:小孩子認得貓只要指給他看一兩次就夠了,AI卻需要成百上千張圖片,才能掌握貓的特徵。
為此,人工智慧科學家嘗試結合遷移學習開發一系列演算法,節約人工標註樣本的時間,讓模型在少量的標註資料上,也能取得好的效果,可以理解為賦予AI“舉一反三”的能力。“例如像電商評論情感分類這樣一個任務,用傳統的深度學習模型需要數萬條資料才能達到85%左右的效果,但是如果採用深度遷移學習技術,數百條資料就能達到同樣的效果。”蘇海波說,我們判斷認知智慧未來會迎來黃金十年的發展,為此百分點成立了認知智慧實驗室。除了深度遷移學習技術,實驗室還會重點研發多語種自然語言處理技術,幫助認知智慧實現跨種族、國際化。
“未來我們會與各大高校和研究機構開展合作,建立聯合實驗室,共同探索更多前沿的認知智慧技術,包括各個重點行業的知識圖譜構建、自動問答等等。基於這些技術,實驗室會研發出更多行業落地的應用產品,為客戶創造價值,用認知智慧推動社會進步。”蘇海波說。(記者 張佳星)