進擊的人工智慧：產品視角解析“對話機器人”

機器人百度人工智慧 · 發表 2018-11-02 12:46:51

摘要：探討對話機器人的本質需求、場景和價值；來自嘉賓@趙帥的分享，（優護家聯合創始人，前微軟小冰初創團隊產品經理）的，在編輯整理成萬字長文，值得AI產品經理們細細品味～序言任何一款產品的出現，都是源自使用者需求。要麼是已經存在的存量需求，...

探討對話機器人的本質需求、場景和價值；來自嘉賓@趙帥的分享，（優護家聯合創始人，前微軟小冰初創團隊產品經理）的，在編輯整理成萬字長文，值得AI產品經理們細細品味～

序言

任何一款產品的出現，都是源自使用者需求。要麼是已經存在的存量需求，要麼是正在規模化的增量需求 ，對話機器人也不例外。當我們在談論“對話機器人”產品時，我們該如何看待它背後的需求呢？

本文，我將試圖站在純產品的視角，去分析作為一款產品，對話機器人背後的需求和產品邏輯。文中我無意去對比各家對話機器人的優劣，也不討論某款對話機器人的產品觀或方法論。

1探索“對話”行為背後的需求

首先，我們試圖探索“對話”這一行為的場景與背後的需求。

在《人類簡史》一書中，認為語言能力是智人區別於其他猿類最重要的特質和能力，因為語言能力，智人可以互相通過對話而形成更豐富的互動，從而才有了協作和後來的文明。

人類有三種最直接的方式來使用語言：“一對零”、“一對多”、“一對一” 。

“一對零”是自我內化的反思、總結、沉澱，不向外做互動和分享。“一對多”是廣播式的宣講和相對單向的輸出，譬如開大會或者發號施令。“一對一”是對話，群聊也是由許多的“一對一”構成的，所以我認為不存在真正意義上的“多對多”對話。我認為對話是我們人與外界進行互動的最直接即時的途徑（注意“ 即時 ”很重要） 。

所謂對話，一定是一個雙方互動行為，並且互為I/O（input / output）的過程。比如兩個人對話，每個人所說的話，對於自己而言是輸出，對於對方而言是輸入。原則上，對話可以永遠持續下去。但我們幾乎從未見過兩個人會永遠在對話，那是因為，如果需要對話持續下去，雙方都需要保持參與，任何一方覺得疲勞或者無價值感了，對話就會終止。

對話的場景更加貼近我們的生活行為，它頻次最高，且環境開放多變，分析它背後的需求並不容易。現在，我們需要回答兩個問題。

1.1 對話為什麼能夠開始？

我認為人在對話中存在三個層面的需求。

第一層，是 基礎問答 的需求 ，可以描述為：我有一個問題，請你回答我。二次追問的問題，屬於新問題，這個過程，非常類似於我們今天所使用的搜尋引擎。

第二層，是 任務流程協作 的需求，以達成某種目的為止 ，可以描述為：我想請你幫我買一張明天下午14:00-18:00出發，北京到上海的機票，經濟艙，儘可能便宜，最好是東航的。我們和朋友相約去逛街，拜託同事幫忙預定會議室，接受閨蜜的請求明早叫她起床，這些都是任務流程協作的需求。

第三層，是共同的 情感建立 ，無論喜怒哀樂 。聊天的目標很難定量量化，我們更多是嘗試定性地去制定聊天的目標。可能是心情不好需要人陪，也可能是好事情需要向好朋友分享，我們需要對話來表達進行最直接即時的表達。我並不認為只有孤獨的情感才需要對話 ，人作為擁有萬年發展歷程的群居動物，與他人進行情感分享是早已刻入基因的特質。只是，我們建立的情感在不同人之間會有所不同，對於信任之人的情感建立會很深刻，而對於點頭之交則會保留許多。

開啟一段對話一定源自上述的某種需求，而開啟的契機則是一個相對明確的話題，哪怕只是一句“我餓了”。

1.2 對話為什麼會持續？

對話能夠持續，是有兩個層面的原因。

第一個原因，是至少一方的需求沒有得到滿足 。比如我去提問題，對方回答我不滿意，我就會持續追問。兩個女生在一起聊八卦，聽的人很入神，講的人才有成就感能繼續講下去。

第二個原因，是雙方相對平等 。如果我提了個問題，或者請對方幫個忙，但是對方始終是一種高姿態不搭理我，那我就很容易放棄，不想聊了。反過來，如果對方對我過分尊敬，總在說一些沒有營養的恭維拍馬屁的話，時間久了，我也會變得更虛榮，而且會覺得很無聊。所以，人不會和自己階層或者品味相差太多的人聊天，絕大多數人更不會和寵物長時間聊天。

對話會終止，最根本的原因是，雙方都放棄了這輪對話。感性一些來描述對話終止的原因，可以認為是雙方都覺得“疲憊”了，也就是這一輪對話的能耗消耗殆盡，哪怕是情侶之間說甜言蜜語，聊個兩三千句也會覺得累了，也會在十幾個回合的互道“晚安”中結束本次對話。

所以，對話總會終止， 能耗殆盡就會終止 。

2“對話機器人”產品的發展

源自搜尋引擎

在我以前的文章《進階之路：站在高視角看產品是一種怎樣的體驗》中，講述過一個概念，叫做“知識詛咒” ，簡單說，現在我明白一件事情，但是要完整清楚的講授給你，是很難的，因為我們所擁有的知識背景不同，我們對同一件事情的理解不同。這也就解釋了，為什麼很多老師在上課的時候索然無味，很多人做Presentation的時候顯得蒼白無力，這其實是知識詛咒在起作用。

知識詛咒帶來一個很大的問題，就是每當我們接觸到一個陌生事物時，都會和自己的背景知識進行類比 ，譬如對於長髮飄飄的素顏美女，在我所知中，這類美女一般都是家境不錯，待人溫柔，家教優良，所以當我再次見到一個類似的美女時，我會做相似的第一印象類比。

不只是美女，我們幾乎所有的認知都源自於過往的背景知識。

在人類發展的歷史上，對於即時的問答需求幾乎時時刻刻都存在，最早大家是詢問部落中最年長的智者，後來大家互相都有了知識儲備，就可以通過對話來進行基本的問答和辯論，這一個過程持續了千萬年。同一個問題，最早時只能去問一個人，得到一個答案，到後來，可以去問很多人，得到許多答案，然後“擇其善者而從之”。如果我能把所有人都問一遍，可能會得到一個巨大的答案集合，我需要過濾、排序、取捨，你發現，這個過程就是“搜尋引擎” 。我們使用搜索引擎時，是通過一個“輸入框”輸入想問的問題或者關鍵詞，然後搜尋引擎會丟給我一個經過相關性排序和優化的答案集合。

但我認為兩個原因，會導致搜尋引擎會逐漸向對話機器人演變 。

其一，精準答案的需求愈發旺盛

搜尋引擎從簡單的資訊集合展示，逐漸向精準答案給予，這個已經持續了好幾年。“百度阿拉丁”就是這方面的典型，譬如當你問“北京天氣”，百度搜索結果頁第一項是經過精心設計的天氣卡，會通過豐富的UI展示天氣相關的資訊。在頭部熱門搜尋詞中，阿拉丁已經可以覆蓋大多數，但是對於腰部需求和長尾需求，隨著資訊爆炸，人們對於翻多頁進行搜尋的忍耐度會越來越低，對於“快”“準”的需求只會越來越大。

其二，搜尋場景下輸入能耗太大

從能耗體驗的角度來說，搜尋的輸入框遠高於對話聊天的輸入框，即使是同一個話題的持續輸入，對話聊天的疲勞感也會明顯低於搜尋。如果今天人們每天平均提問的次數是N，那麼幾年後會迅速到10N，體驗不升級會很難讓使用者滿意。而回歸對話的方式，是一種很好的體驗優化，可以抵消需求的增長。

文後續內容，詳細請點選：https://t.zsxq.com/6iaauFa

進擊的人工智慧：產品視角解析“對話機器人”

1探索“對話”行為背後的需求

2“對話機器人”產品的發展

您可能也會喜歡…