進擊的人工智慧:產品視角解析“對話機器人”
探討對話機器人的本質需求、場景和價值;來自嘉賓@趙帥的分享,(優護家聯合創始人,前微軟小冰初創團隊產品經理)的,在編輯整理成萬字長文,值得AI產品經理們細細品味~
序言
任何一款產品的出現,都是源自使用者需求。要麼是已經存在的存量需求,要麼是正在規模化的增量需求 ,對話機器人也不例外。當我們在談論“對話機器人”產品時,我們該如何看待它背後的需求呢?
本文,我將試圖站在純產品的視角,去分析作為一款產品,對話機器人背後的需求和產品邏輯。文中我無意去對比各家對話機器人的優劣,也不討論某款對話機器人的產品觀或方法論。
1探索“對話”行為背後的需求
首先,我們試圖探索“對話”這一行為的場景與背後的需求。
在《人類簡史》一書中,認為語言能力是智人區別於其他猿類最重要的特質和能力,因為語言能力,智人可以互相通過對話而形成更豐富的互動,從而才有了協作和後來的文明。
人類有三種最直接的方式來使用語言:“一對零”、“一對多”、“一對一” 。
“一對零”是自我內化的反思、總結、沉澱,不向外做互動和分享。“一對多”是廣播式的宣講和相對單向的輸出,譬如開大會或者發號施令。“一對一”是對話,群聊也是由許多的“一對一”構成的,所以我認為不存在真正意義上的“多對多”對話。我認為對話是我們人與外界進行互動的最直接即時的途徑(注意“ 即時 ”很重要) 。
所謂對話,一定是一個雙方互動行為,並且互為I/O(input / output)的過程。比如兩個人對話,每個人所說的話,對於自己而言是輸出,對於對方而言是輸入。原則上,對話可以永遠持續下去。但我們幾乎從未見過兩個人會永遠在對話,那是因為,如果需要對話持續下去,雙方都需要保持參與,任何一方覺得疲勞或者無價值感了,對話就會終止。
對話的場景更加貼近我們的生活行為,它頻次最高,且環境開放多變,分析它背後的需求並不容易。現在,我們需要回答兩個問題。
1.1 對話為什麼能夠開始?
我認為人在對話中存在三個層面的需求。
第一層,是 基礎問答 的需求 ,可以描述為:我有一個問題,請你回答我。二次追問的問題,屬於新問題,這個過程,非常類似於我們今天所使用的搜尋引擎。
第二層,是 任務流程協作 的需求,以達成某種目的為止 ,可以描述為:我想請你幫我買一張明天下午14:00-18:00出發,北京到上海的機票,經濟艙,儘可能便宜,最好是東航的。我們和朋友相約去逛街,拜託同事幫忙預定會議室,接受閨蜜的請求明早叫她起床,這些都是任務流程協作的需求。
第三層,是共同的 情感建立 ,無論喜怒哀樂 。聊天的目標很難定量量化,我們更多是嘗試定性地去制定聊天的目標。可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我們需要對話來表達進行最直接即時的表達。我並不認為只有孤獨的情感才需要對話 ,人作為擁有萬年發展歷程的群居動物,與他人進行情感分享是早已刻入基因的特質。只是,我們建立的情感在不同人之間會有所不同,對於信任之人的情感建立會很深刻,而對於點頭之交則會保留許多。
開啟一段對話一定源自上述的某種需求,而開啟的契機則是一個相對明確的話題,哪怕只是一句“我餓了”。
1.2 對話為什麼會持續?
對話能夠持續,是有兩個層面的原因。
第一個原因,是至少一方的需求沒有得到滿足 。比如我去提問題,對方回答我不滿意,我就會持續追問。兩個女生在一起聊八卦,聽的人很入神,講的人才有成就感能繼續講下去。
第二個原因,是雙方相對平等 。如果我提了個問題,或者請對方幫個忙,但是對方始終是一種高姿態不搭理我,那我就很容易放棄,不想聊了。反過來,如果對方對我過分尊敬,總在說一些沒有營養的恭維拍馬屁的話,時間久了,我也會變得更虛榮,而且會覺得很無聊。所以,人不會和自己階層或者品味相差太多的人聊天,絕大多數人更不會和寵物長時間聊天。
對話會終止,最根本的原因是,雙方都放棄了這輪對話。感性一些來描述對話終止的原因,可以認為是雙方都覺得“疲憊”了,也就是這一輪對話的能耗消耗殆盡,哪怕是情侶之間說甜言蜜語,聊個兩三千句也會覺得累了,也會在十幾個回合的互道“晚安”中結束本次對話。
所以,對話總會終止, 能耗殆盡就會終止 。
2“對話機器人”產品的發展
源自搜尋引擎
在我以前的文章《進階之路:站在高視角看產品是一種怎樣的體驗》中,講述過一個概念,叫做“知識詛咒” ,簡單說,現在我明白一件事情,但是要完整清楚的講授給你,是很難的,因為我們所擁有的知識背景不同,我們對同一件事情的理解不同。這也就解釋了,為什麼很多老師在上課的時候索然無味,很多人做Presentation的時候顯得蒼白無力,這其實是知識詛咒在起作用。
知識詛咒帶來一個很大的問題,就是每當我們接觸到一個陌生事物時,都會和自己的背景知識進行類比 ,譬如對於長髮飄飄的素顏美女,在我所知中,這類美女一般都是家境不錯,待人溫柔,家教優良,所以當我再次見到一個類似的美女時,我會做相似的第一印象類比。
不只是美女,我們幾乎所有的認知都源自於過往的背景知識。
在人類發展的歷史上,對於即時的問答需求幾乎時時刻刻都存在,最早大家是詢問部落中最年長的智者,後來大家互相都有了知識儲備,就可以通過對話來進行基本的問答和辯論,這一個過程持續了千萬年。同一個問題,最早時只能去問一個人,得到一個答案,到後來,可以去問很多人,得到許多答案,然後“擇其善者而從之”。如果我能把所有人都問一遍,可能會得到一個巨大的答案集合,我需要過濾、排序、取捨,你發現,這個過程就是“搜尋引擎” 。我們使用搜索引擎時,是通過一個“輸入框”輸入想問的問題或者關鍵詞,然後搜尋引擎會丟給我一個經過相關性排序和優化的答案集合。
但我認為兩個原因,會導致搜尋引擎會逐漸向對話機器人演變 。
其一,精準答案的需求愈發旺盛
搜尋引擎從簡單的資訊集合展示,逐漸向精準答案給予,這個已經持續了好幾年。“百度阿拉丁”就是這方面的典型,譬如當你問“北京天氣”,百度搜索結果頁第一項是經過精心設計的天氣卡,會通過豐富的UI展示天氣相關的資訊。在頭部熱門搜尋詞中,阿拉丁已經可以覆蓋大多數,但是對於腰部需求和長尾需求,隨著資訊爆炸,人們對於翻多頁進行搜尋的忍耐度會越來越低,對於“快”“準”的需求只會越來越大。
其二,搜尋場景下輸入能耗太大
從能耗體驗的角度來說,搜尋的輸入框遠高於對話聊天的輸入框,即使是同一個話題的持續輸入,對話聊天的疲勞感也會明顯低於搜尋。如果今天人們每天平均提問的次數是N,那麼幾年後會迅速到10N,體驗不升級會很難讓使用者滿意。而回歸對話的方式,是一種很好的體驗優化,可以抵消需求的增長。
文後續內容,詳細請點選:https://t.zsxq.com/6iaauFa