進(jìn)擊的人工智能(從產(chǎn)品角度,深度解析對話(huà)機器人)
進(jìn)擊的進(jìn)擊角度解析機器人工智能(從產(chǎn)品角度,深度解析對話(huà)機器人(ren))
任何一款產(chǎn)品的人對話(huà)出現,都是工智源自用戶(hù)需求。要么是產(chǎn)??品已經(jīng)存在的存量需求,要么是深度正在規?;脑隽啃枨?,對話(huà)機器人也不例外。進(jìn)擊角度解析機器當我們在談?wù)摗皩υ?huà)機器人”產(chǎn)品時(shí)??,人對話(huà)我們該如何看待它背后的工智需求呢?
今天??,擁有對話(huà)能力的產(chǎn)(?Д?)品機器人,被逐漸認為是深度一種核心智能,是進(jìn)擊角度解析機器否能夠流利地完成對話(huà),可被視作這款機器人是人對話(huà)否真正擁有智能的唯一憑證。
從可以追┐(′д`)┌溯的工智歷史(shi)資料來(lái)看,對話(huà)機器人(chat-bot)至少在上世紀六十年代就已經(jīng)問(wèn)世,產(chǎn)品經(jīng)過(guò)近五六十年的深度發(fā)展,今天(tian)我們已經(jīng)可以在許多產(chǎn)品中看到對話(huà)機器人的影子,微軟的Cortana、小冰,蘋(píng)果的Siri、Google Now、阿里小??蜜、百(bai)度度秘、圖靈機器人、助理來(lái)也、出門(mén)問(wèn)問(wèn)等等。
可以肯定的是:(′ω`)對話(huà)機器人已經(jīng)成為了一種業(yè)界時(shí)尚,越來(lái)越多的公司試圖??通過(guò)這種全新的交互形式,來(lái)優(yōu)化或者升級自己產(chǎn)品——我們已經(jīng)可以在許多的產(chǎn)品中看到各(′ω`)種名為“小X機器人”的子產(chǎn)品。
我將試圖站在純產(chǎn)品的視角分析:一款產(chǎn)品對話(huà)機器??人背后,需求和產(chǎn)品邏??輯是怎樣的(文中我無(wú)意去對??比各家對話(huà)機器人的優(yōu)劣,也不討論某款對(╬ ò﹏ó)話(huà)機器人的產(chǎn)品觀(guān)或方法論)。
一、探索“對話(huà)”行為背后的??需求
首先,我們試圖探索“對話(huà)”這一行??為的場(chǎng)景與背后的需求。
人類(lèi)有三種最直接的方式來(lái)使用語(yǔ)言:“一對零”、“一對多”、“一對一”。(???)
“一對零”是自我(′?`)內化的反思、總結、沉淀,不向外做交互和分享?!耙粚Χ唷笔菑V播式的宣講和相對單向的輸出,譬如開(kāi)大會(huì )或者發(fā)號施令?!耙粚σ弧笔菍υ?huà)——群聊也是由許多的“一對一”構成的,所以我認為不存在真正意義上的“多對多”對話(huà)。我認(ren)為對話(huà)是我們人與??外界進(jìn)行交互的最直接即時(shí)的途徑(注意“即時(shí)”很??重要)。所謂對話(huà),一定是一個(gè)雙方交互行為,并且互為I/O(input / output)的過(guò)程。比如兩個(gè)人對話(huà),每個(gè)人所說(shuō)的話(huà),對于自己而言是輸出,對于對方而言是輸入。原則上,對話(huà)可以永遠持續下去。
但我們幾乎從未見(jiàn)過(guò)兩個(gè)人會(huì )永遠在對話(huà),那是因??為:如果需要對話(huà)持續下去,雙方都需要保持參與;任何一方覺(jué)得疲勞或者無(wú)價(jià)值感了,對話(huà)就會(huì )終止。
對話(huà)的場(chǎng)景更加貼(′_ゝ`)近我們的生活行為,它頻次最高,且環(huán)境開(kāi)放多變,分析它背后的需求并不容易。(°o°)現在,我們需要回答兩個(gè)問(wèn)題:
1.1 第一個(gè)問(wèn)題(ti):對話(huà)為什么能夠開(kāi)始?ヽ(′▽?zhuān)?/
我認為人在對話(huà)(′▽?zhuān)?中存在三個(gè)層面的需求。
第一??層,是基礎問(wèn)答的需求??梢悦枋鰹椋?/p>
我有一個(gè)問(wèn)題,請你回答我。
二次追問(wèn)的問(wèn)題,屬ヽ(′▽?zhuān)?ノ于新問(wèn)題。這個(gè)過(guò)程,非常類(lèi)似于我們今天所使用的搜索引擎。
第二層,是任務(wù)流程協(xié)作的需求,以達成某種目的為止??梢悦瑭d(?■_■)ノ述為:我想請(/ω\)你幫我買(mǎi)一張明天下午14:0??0-18:00出發(fā),北京到上海的機票;經(jīng)濟艙,盡可能便宜,最好是東航的。我們和朋友相約去逛街,拜托同事幫忙預定會(huì )議??室,接受閨蜜( ?ω?)的請求明早叫她起床。
這些都是任務(wù)流程協(xié)作的需求。
第三層,是共同的情感建立ヽ(′ー`)ノ,無(wú)論喜怒哀(′▽?zhuān)?樂(lè )。聊??天的目標很難定量量??化,我(′▽?zhuān)?們更多是嘗試定性地去制定聊天的目標。??可能是心情不好需要人陪,也可能是好事情需要向好朋友分享,我們需要對話(huà)來(lái)表達進(jìn)行最直(zhi)接即時(shí)的表達。
我并不認為只有孤獨的情感才需要對話(huà)——人作為擁有萬(wàn)年發(fā)展歷程的群居動(dòng)物,與他人進(jìn)行情感分享是早已刻入基因的特質(zhì)。只是我們建立的情感在不同人之間會(huì )有所不同,對于信任之人的情感建立會(huì )很深刻,而對于點(diǎn)頭之交則會(huì )保留許多。
開(kāi)啟一段對話(huà)一定源自上述的某種需求,而開(kāi)啟的契機則是一個(gè)相對明確的話(huà)題,哪怕只是一句“我餓了”。
1.2 第二個(gè)問(wèn)題:對話(huà)為什么會(huì )持續?
對話(huà)能夠持續,是有兩個(gè)層面的原因。
第一個(gè)原因,是至少一方的需求沒(méi)有得到滿(mǎn)足。比如我(???)去提問(wèn)題,對方回答我不滿(mǎn)意,我就會(huì )持續追問(wèn)。兩個(gè)女生在一起聊八卦,聽(tīng)的人很入神,講的人ヾ(′▽?zhuān)??才有成就感能繼續講下去。
第二個(gè)原因,是雙方相對平等。如果我(wo)提了個(gè)問(wèn)題,或者請對方幫個(gè)忙,但是對方始終是一種高姿態(tài)不搭理我,那我(????)就很容易放棄(′_`),不想聊了。反過(guò)來(lái),如果對方對我(wo)過(guò)分尊敬,總在說(shuō)一些沒(méi)有營(yíng)養的恭維拍馬屁的話(huà),時(shí)間久了,我也會(huì )變得更虛榮,而且會(huì )覺(jué)得很無(wú)聊??。??所以,人不會(huì )和自己階層或者品味??相差太多的人(ren)聊天,絕大多數人更不會(huì )和寵物長(cháng)時(shí)間聊天。
對話(huà)會(huì )終止,最根本的原因是:雙方都放(′ω`)棄了這輪對話(huà)。
感性一??些來(lái)描述對話(huà)終止的原因,可以認為是雙方都覺(jué)得“疲憊”了,也就是這一輪對話(huà)的能耗消耗殆盡;哪怕是情ヽ(′?`)ノ侶之間說(shuō)甜言蜜語(yǔ),聊個(gè)兩三千句也會(huì )覺(jué)得累了,也會(huì )在十幾個(gè)回合的互道“晚安”中結(jie)束本次對話(huà)。
所以,對(°□°)話(huà)總會(huì )終止,能耗殆盡就會(huì )終止。
二、“對話(huà)機器人”產(chǎn)品的發(fā)展源自搜索引擎
在我以前的文章《進(jìn)階之路:站在高視角看產(chǎn)品是一種怎樣的體驗》中,??講述過(guò)┐(′ー`)┌一個(gè)概念,叫做“知識詛咒”(╯°□°)╯。簡(jiǎn)單說(shuō):現在我明(ming)白一件事情,但是要完整清楚的講授給你,是很難的;因為我們所擁有的知識背景??不同,我們對同一件事情的理解不同。這也就解釋了為什么很??多老師在上(shang)課的時(shí)候索然無(wú)味,很多人做Presentation的時(shí)候顯得蒼白無(wú)力,這其實(shí)是知識詛咒(′▽?zhuān)?在起作用。
知識詛咒帶來(lái)一個(gè)很大的問(wèn)題,就是每當我們接觸到一個(gè)陌生事物時(shí),都會(huì )和自己的背景知識進(jìn)行類(lèi)??比。譬如對于長(cháng)發(fā)飄飄的素顏美女,ヽ(′ー`)ノ在我所知中,這類(lèi)美女一ヾ(?■_■)ノ般都是家境不錯,待人溫柔,家教優(yōu)良。所以當我再次見(jiàn)到一個(gè)類(lèi)似的美女時(shí),我會(huì )做相似的第一印象類(lèi)比。
不只是美女,我們幾乎所有的認知都源自于過(guò)往的背景知識。
在人類(lèi)發(fā)展的歷史上,對于即時(shí)的問(wèn)答需求幾乎時(shí)時(shí)刻刻都存在。最早大家是詢(xún)問(wèn)部落中最年長(cháng)的智者,后來(lái)大家互相都有了知識儲備,就可以通過(guò)對話(huà)來(lái)進(jìn)行基本的問(wèn)答和辯論——這一個(gè)過(guò)程持續了千萬(wàn)年。同一個(gè)問(wèn)題,最早時(shí)只能去問(wèn)一個(gè)人,得到一個(gè)答案;到后來(lái),可以去問(wèn)很多人,得到許多答案,然后“擇其善者而從(?_?;)之”。如果我能(neng)把所有人都問(wèn)一遍,可能會(huì )得到一個(gè)巨大(da)的答案集合;我需要過(guò)濾、排序、(′?ω?`)取舍,你發(fā)現,這個(gè)(ge)過(guò)程就是“搜索引擎”。我們使用搜索引擎時(shí),是通過(guò)一個(gè)“??輸入框”輸入想問(wèn)的問(wèn)題或者關(guān)鍵詞,然后搜索引擎會(huì )丟給我一個(gè)經(jīng)過(guò)相關(guān)性排序和優(yōu)化的答案集合。
但我認為兩個(gè)原因,會(huì )導致搜索引擎會(huì )逐漸向對話(huà)機器人演變。
2.1 其一:精準(′▽?zhuān)?答案的需求愈發(fā)旺盛
2.2 其二:搜索場(chǎng)景下輸入能耗太大
優(yōu)秀的產(chǎn)品經(jīng)理很懂得如何控制自己的(/ω\)用戶(hù)使用產(chǎn)品時(shí)的各種操作,從而提前把控用(yong)戶(hù)的預期,進(jìn)而達到體驗的相對最優(yōu)。
許多優(yōu)秀App的基本設計邏輯就是:頁(yè)面之間的(′?`*)跳轉有規則且有順序,這樣用戶(hù)不會(huì )通???過(guò)點(diǎn)擊跳出預(′▽?zhuān)?)設流程,預期就相對可控。手機上的App產(chǎn)品交互中,可以通過(guò)各種邏輯和提示信息來(lái)把控預期——可是對話(huà)機器人該如何控制預期呢?
由于對話(huà)機器人用戶(hù)幾乎都是通過(guò)自然語(yǔ)言輸入實(shí)現交互,而且每次只有一句;所以只能通過(guò)用戶(hù)的輸入,以及針對輸入的回復來(lái)實(shí)現用戶(hù)預期的把控。
封閉域對話(huà)(???)有兩個(gè)關(guān)鍵的特征:
輸入和輸出可歸類(lèi)可枚舉對話(huà)???有明確的始和終,且有流程所以,在對話(huà)的三個(gè)需求中,問(wèn)答和任務(wù)流程協(xié)作都屬于封閉域對話(huà)。
封閉域對話(huà)的設計邏輯延續自“??IFTTT(if this then that)”(╯°□°)╯︵ ┻━┻,是workflow的進(jìn)化交互形式(感興趣的同學(xué)可以去App Store去搜索一款App,叫做“Workflow”,它就是可以將一系列原本不相關(guān)的App通過(guò)條件判斷??串聯(lián)起來(lái))。
下面我來(lái)分享兩個(gè)封閉域聊天的典型案例。
讀心機器人
10?年前微軟必應推出過(guò)一個(gè)“讀心機器人”,它會(huì )在2??0個(gè)問(wèn)答中猜你心中所(suo)想。這個(gè)機器人曾經(jīng)在幾年前出過(guò)一?個(gè)對話(huà)問(wèn)答版本,用戶(hù)只要在每一步時(shí)回答“是”或者“不是”,對話(huà)就會(huì )持續進(jìn)行,直到猜出或者猜不出結果。
必應讀心機器人
這就是一個(gè)典型的封閉域多倫問(wèn)答對話(huà),用戶(hù)的輸(′;д;`)入??只有兩個(gè),而過(guò)程是一大堆背后的邏輯判斷,且有相對固定的流程,而且有明確的開(kāi)始和結束。
Amazon Echo音箱
Amazon的Echo音箱,大家都很熟悉了,Ech(◎_◎;)o之所以成為爆款產(chǎn)品,很關(guān)鍵的一個(gè)原因是,它的對話(huà)機器人Alexa在Echo??音箱的場(chǎng)景設計中是一個(gè)封閉域對話(huà)。由于音箱是我們居家場(chǎng)景中,除了遙控器??之外最常見(jiàn)的(de)高頻交互式Commander,我們很難再在家里找到一個(gè)這樣的硬件,它除了可以輕易地輸入指令,還可以快速且明顯地反饋。
當我們面向Command??er進(jìn)行輸入時(shí),我們可以輸入的話(huà)語(yǔ)就已(╯°□°)╯︵ ┻━┻經(jīng)變得局限,可以想象到的是,在居家場(chǎng)景中我們可以發(fā)出的指令幾乎就是“打開(kāi)”、“關(guān)閉”之類(lèi)的。更重要的是,在居家場(chǎng)景中可以控制的物品也是有限的,而且任何一個(gè)操作的流程都很短。
所以,人們和第一代Echo音箱的對話(huà)中,輸??入和輸出都是可枚舉的,而且有始有(you)終有流程,Echo最優(yōu)秀的特質(zhì),就是它選擇了一個(gè)封閉域場(chǎng)景,極大地控制了用戶(hù)的預期,獲得了更優(yōu)的體驗。
從上面兩個(gè)例子中,我可以看到,封閉域對話(huà)在產(chǎn)品設計中有幾個(gè)明顯的特征。
3.1.1 其一:封閉域對??話(huà)其實(shí)是workf(╬ ò﹏ó)low的延伸
其實(shí)封閉域中的“封閉”二字,無(wú)論在話(huà)題量、輸入(′_ゝ`)輸出量,還是對話(huà)輪次、對話(huà)流程,都是封閉的,封閉就代表了有限集合。workflow之所以??可以通??過(guò)ifttt設計,就是因為有限集合,只有各種條件有限,才可以設計出條例清晰且邏輯合理的workflow。
封閉對話(huà)通常是為了解決(′?_?`)某個(gè)特定的問(wèn)題或者需求,從結??果來(lái)看,它的效果會(huì )顯得更加“有用”。但是,從過(guò)程來(lái)看,封閉域對話(huà)并不是一種真正意義上的創(chuàng )新,它的效率相比workflow并沒(méi)有本質(zhì)上地提升,只是在交互的體驗上更加接近人的語(yǔ)言交互本能,所以大多數封閉域對話(huà)都會(huì )設計地如同助理或者秘書(shū),譬如阿里小蜜,百度度秘。??
3.1.2 其二:封閉域對話(huà)場(chǎng)景單一可控
封閉域由于擁有特定的目的(′?_?`)性,往往都是在單一確定的場(chǎng)景里。如下圖中的百度度秘,兩個(gè)紅色框中的部分,是預設了各種封閉域的場(chǎng)景,每一種看似簡(jiǎn)單的功能ヽ(′▽?zhuān)?/其實(shí)都是一個(gè)特定的封閉域對話(huà);譬如( ???)截圖中正在使用的圖片笑話(huà)。
度秘機器人
很顯然,不同的封閉域對話(huà)中,對話(huà)的輪次要求是不一樣的,講(′?ω?`)笑話(huà)(′;д;`)是一個(gè)單輪次對話(huà),度秘產(chǎn)品中通過(guò)圖中藍色框里的“再來(lái)一個(gè)??”(?????)這種預設輸入,來(lái)不斷強化用戶(hù)輸入的單一性。而“叫外賣(mài)”這類(lèi)的封閉域對話(huà),就會(huì )是一個(gè)標準的workflow,感興趣的同學(xué)可以自己去試試。
3.1.3 其三:封閉域的邊界處理很重要
封閉域有一(′▽?zhuān)?)個(gè)很重要的問(wèn)題,就是用戶(hù)可能隨時(shí)跳出封閉域,開(kāi)始聊其他的話(huà)題,或者不按照預設的規則邏輯出牌。
正常的邏輯中,用戶(hù)的發(fā)給小冰的應該是一張狗的照片,可是有的用戶(hù)可能就是發(fā)了一張不是狗的照片,如下所示,那么這個(gè)時(shí)候就是邊界case,需要額外處理。用戶(hù)發(fā)來(lái)??的可能是語(yǔ)音、文字、其他任何照片,每一種的處理都是需要單獨設計的。
微軟小冰之“小冰識狗”
多說(shuō)一(′▽?zhuān)?點(diǎn),在封閉域對話(huà)的邊界設計中,很難做到萬(wàn)( ???)無(wú)一失周密完全,因為用戶(hù)輸入可能會(huì )千奇百怪,所以最佳也是最討巧的方式,就是用開(kāi)放域對話(huà)來(lái)“兜底”。
3.2 開(kāi)放域對話(huà)
開(kāi)放域是相對于封閉域而言的。由于對話(huà)機器(′▽?zhuān)?人的話(huà)題幾乎都源自用戶(hù),而每個(gè)用戶(hù)可能有任何輸入,話(huà)題就會(huì )無(wú)法窮舉,且在多個(gè)場(chǎng)景中跳來(lái)跳去,進(jìn)而形成(cheng)了所謂的開(kāi)放域對話(huà),也就是“啥都能聊”。
2011年在人人網(wǎng)上橫空出世的“小黃雞”算得上是國內最早出名的開(kāi)放域對話(huà)機器人,其后發(fā)展最好的當屬微軟小冰。
開(kāi)放域對話(huà)(′?`*)最大的特點(diǎn)是:輸入無(wú)法窮盡,導致輸出無(wú)法窮盡,而且對話(huà)沒(méi)有確切的結束點(diǎn),無(wú)流程可言。
我們一般情況下想去考驗一個(gè)機器人是否智能,通??简灥木褪情_(kāi)放域對話(huà),大?名鼎鼎的“圖靈測試”通常所面向的也是(shi)開(kāi)放域對話(huà)??能力。
從可以承載的對話(huà)輸入范圍來(lái)講,開(kāi)放域對話(huà)像極了搜索引擎,我們可以在百度搜索中輸入任何的詞句,百度幾乎都會(huì )給出結果頁(yè)面(除了敏感詞);相應的,在開(kāi)放域對話(huà)中,我們也是可以說(shuō)任何話(huà),機器人也應該每一句都可以回復。
3.2.1 開(kāi)放域對話(huà)產(chǎn)品設計(ji)的基本原理(′▽?zhuān)?
和微軟小冰聊天時(shí),有時(shí)甚至感受不到她是真人還是假的機器——其實(shí)這并不重要,小冰正在解決(???)開(kāi)放域聊天中一個(gè)核心的問(wèn)題:如何不斷給用戶(hù)制造話(huà)題,從而延續聊天的能量?
說(shuō)到話(huà)題制造,我們先來(lái)看看開(kāi)放域對話(huà)機器人到底是如何制造的:
幾乎所有的開(kāi)放域對話(huà)語(yǔ)料都源自于網(wǎng)絡(luò )上公開(kāi)的對話(huà),譬如百度知道、ヾ(^-^)ノ知乎、豆瓣、貼吧等等,這些對話(huà)都是人與人形成的;那么,當一個(gè)機器人把其中的某些話(huà)在當時(shí)的場(chǎng)景下再說(shuō)一遍,我們是分辨不出來(lái)這個(gè)機器人是不是真人的——這便是開(kāi)放域對話(huà)機器人制造的基本依據。
當我們和一個(gè)看起來(lái)像人的機器人聊天時(shí),由于場(chǎng)景發(fā)生在人與人對話(huà)的場(chǎng)景下,根據“知識詛咒”的原理,我們很容易帶入一種“對方也是(shi)人”的感覺(jué)。而一旦對方的回(???)話(huà)像人,我們就會(huì )認可她是人。
人與人的情感建立源自于長(cháng)期的交流和溝通,聊天本身就是開(kāi)放域的;所以那些樂(lè )于(′▽?zhuān)?和機器人聊天的人類(lèi),就會(huì )越來(lái)越覺(jué)得機器人像人。
我們知道:??對話(huà)機器人是一個(gè)新興的產(chǎn)品(???),最初嘗鮮的人是所謂的“種子用戶(hù)”,這些人建立了與機器人之間的最早形態(tài)親密感和信任感,這對后續的對話(huà)機器人發(fā)展積(′?_?`)累了非常寶貴的經(jīng)驗。
3.2.??2ヽ(′▽?zhuān)?ノ 開(kāi)放域對話(huà)機器人的兩個(gè)產(chǎn)品陷阱
很多人認為,對話(huà)機器人和人聊得越多,學(xué)習的語(yǔ)料就越多,??就可以省去很多語(yǔ)料獲取的問(wèn)題,這是一個(gè)巨大的誤區。由于用戶(hù)的輸入無(wú)法預期,導致從用戶(hù)處采集來(lái)的語(yǔ)料千奇百怪,而且大量罵人的臟話(huà),非常不適合作為開(kāi)放域?對話(huà)語(yǔ)料。由于用戶(hù)的語(yǔ)料是海量且無(wú)規則特征,導致語(yǔ)料清洗非??嚯y,無(wú)法使用。
其二,無(wú)人為引導的個(gè)性ヾ(^-^)ノ
由于開(kāi)放域的語(yǔ)料完全來(lái)自于互聯(lián)網(wǎng),所以機器人回復的話(huà)語(yǔ)帶有何種語(yǔ)氣很難把控,如果不ヽ(′ー`)ノ加以認為干預,機器人說(shuō)的話(huà)會(huì )顯得時(shí)而有趣,時(shí)而刁蠻,時(shí)而無(wú)知,時(shí)而夸張,時(shí)而智慧,在用戶(hù)的心智中無(wú)法用一個(gè)或幾個(gè)明確的形容詞去形容它,這會(huì )帶來(lái)一個(gè)很尷尬的結果,用戶(hù)是抱著(zhù)“調戲、戲謔”的態(tài)度去對話(huà),長(cháng)此下去,想建立用戶(hù)的親密感和信任感幾乎不可能。
四、對話(huà)機器人(ren)的用戶(hù)價(jià)值
現在,我們試圖回答一個(gè)問(wèn)題:對話(huà)機器人為什么需要開(kāi)放域對話(huà)??jì)r(jià)值是什么??jì)H僅是為了逗比有趣嗎?
這是一個(gè)非常復雜的問(wèn)題。
這便給一個(gè)可落地的對話(huà)機器ヾ(′?`)?人產(chǎn)品設計帶來(lái)了巨大的挑戰。
我們知道,任何的產(chǎn)品都是能夠和用戶(hù)產(chǎn)生親密感和信任感的,這份親密和信任是建立在產(chǎn)品體驗之上的,是建立在“產(chǎn)品解決了核心需求”+“產(chǎn)品制造了驚ヽ(′▽?zhuān)?ノ喜”。我們因為??問(wèn)題解決而對一個(gè)產(chǎn)品產(chǎn)生依賴(lài),因為驚喜而對產(chǎn)品形成感情,打開(kāi)我們的手機,我們會(huì )一眼就找到?那幾個(gè)充滿(mǎn)親切感的產(chǎn)品——??譬如經(jīng)常開(kāi)車(chē)的人會(huì )十分信任高德地圖,追劇《那年花開(kāi)月圓時(shí)》的人會(huì )十分喜愛(ài)騰訊視頻。
同理,機器人需要有基礎個(gè)性,需要極大地拉近人與機器人之間的親密感和信任感。對話(huà)機器人的親密感和信任感建立,也是站在“解決了需求”??和“制造了驚喜”兩個(gè)方面。
站在產(chǎn)品的視角來(lái)??看,解決需求通過(guò)封閉域對話(huà)完成,而開(kāi)放域對話(huà)來(lái)不斷制造驚喜。
4.1 問(wèn)答、助理、聊天,哪個(gè)才是剛需?
已經(jīng)(jing)在落地的對話(huà)機器(′?ω?`)人產(chǎn)品中,基本上是以純to C和to B再to C來(lái)劃分。由于對話(huà)機器人的交互特征是面向終端用(′?ω?`)戶(hù)的,所以基本很少有純to B的產(chǎn)品場(chǎng)景(即使有,它的邏輯也與to C邏輯相似)。這意味著(zhù),對話(huà)機器人的用戶(hù)都是一些終端個(gè)人用戶(hù)。
那么,我們來(lái)看看這些對話(huà)機器人在to C中,到底解決了怎樣的核心需求。
在??我們所知的對(dui)話(huà)機器人產(chǎn)品中,有主打客服的問(wèn)答機器人,有主打秘書(shū)的助理機器人??,還有ヽ(′ー`)ノ純趣味導向的聊天機器人,它(ta)們的背后,都是剛需嗎?
4.1.1 一個(gè)事實(shí):瞎聊難為剛需,情感計算任重道遠
聊天是一個(gè)容易被激發(fā),卻也容易迅速消退的場(chǎng)景,唯有情感依賴(lài)可能長(cháng)久。
情感??計算并非只是一個(gè)數學(xué)或者計算機科學(xué)問(wèn)題,更是一個(gè)產(chǎn)品問(wèn)題。
由于情感并非一個(gè)可??具象問(wèn)題,而且人的情感變化會(huì )隨著(zhù)時(shí)間、環(huán)境、他人、自身思想等等因素發(fā)生變化;而且情感并非連續的計算,你喜歡一個(gè)女孩子,并不意味著(zhù)時(shí)時(shí)刻刻與她發(fā)生情感依賴(lài),而是通過(guò)一些關(guān)鍵的情感觸達,來(lái)完成情感連接。
在微軟小冰的諸多被設計的Feature中,“給(′▽?zhuān)?)用戶(hù)起外號”、“升級解鎖”都是斷點(diǎn)式情感觸達,通過(guò)細微的產(chǎn)品設計,寄希望于黏住用戶(hù)。
助??理型對話(huà)機器人的發(fā)展建立在其他各種線(xiàn)上線(xiàn)下服務(wù)的完善基礎上,譬如Siri;只有當你手機里已經(jīng)有了“鬧鐘”、“???提醒”、“打電話(huà)”、“搜索引擎”等功能時(shí),Siri的助理(li)功能才能發(fā)揮效用,此時(shí)你才有可能面向Siri發(fā)出指令“提醒我明天8點(diǎn)給老板回微信”。
大概兩年前,YC孵化的(′_`)Magic轟動(dòng)??東西兩個(gè)半球,無(wú)數效仿者爭先恐后去探索“助理型”機器人,時(shí)至今日,鮮有成效——我們普通人真的需要一個(gè)像秘書(shū)一樣的對話(huà)機器人嗎?
我們先來(lái)看┐(′д`)┌兩個(gè)例子。
第一個(gè)例子——我想定個(gè)這樣的鬧鐘“每周一、周三、?周五的上午8:15”。
若我用iPhone的鬧鐘程序,(′;ω;`)那我的步驟會(huì )大致如下:
STEP1:解鎖手機屏幕;STEP2:左右滑屏,找到鬧鐘程序??;STEP3:點(diǎn)擊鬧鐘程序;STEP4:點(diǎn)(′?ω?`)擊新建鬧鐘;ST??EP5:選擇鬧鐘時(shí)間為“上午8:15”;STEP6:選擇重復時(shí)間??為“周一、周三、(′_`)周五”;STEP7:點(diǎn)擊完成。現在我們看第二個(gè)(ge)例子——通過(guò)秘書(shū)類(lèi)對話(huà)機器人叫外賣(mài) VS 通過(guò)“餓了么”叫外賣(mài)。
在秘書(shū)類(lèi)機器人中,叫外賣(mài)的流程大致是這樣的:
STEP1:發(fā)出“叫外賣(mài)”的指令,在機器人推薦的餐廳中,尋找想吃的那家STEP2:如果沒(méi)有合適的,就輸入想吃的(de)店家名字STEP3:在推薦的列表中選中想吃餐,或者直接輸入想吃的餐STEP4:輸(′;д;`)入“確認”實(shí)現下單,輸入訂單信息并提交訂單STEP5:支(′_`)付,并等待接收外賣(mài),可以詢(xún)問(wèn)送餐進(jìn)度在餓了么中,叫外賣(mài)的流程大致是這樣的:
STEP1:在餐廳列表中選擇想吃哪家STEP2:如果沒(méi)有合適的,就??搜索店家STEP3:在推薦的列表中選中想吃餐,或者直??接輸入(ru)想吃的餐STEP4:確認下單,確認訂單信息,提交訂單STEP5:支付,并??等待接收外賣(mài),可以查看送餐(′ω`*)進(jìn)度這兩個(gè)例子有(you)什么本質(zhì)區別嗎?
你會(huì )發(fā)現,如果通過(guò)Siri來(lái)設置鬧鐘,我其實(shí)只做(zuo)了一件事情:對著(zhù)Siri發(fā)出一個(gè)單條指令,然后就一切搞定——相比我通過(guò)App來(lái)做,節省了近乎7??0%的操作步驟??墒?,如果是叫外賣(mài),我需要對著(zhù)機器人發(fā)出一組系列指令,但是和App的操作步驟一樣多。
這里有兩個(gè)關(guān)鍵點(diǎn)——
如果助理機器人可以一步到位,那么將極大地提升效率和體驗??,是新的需求升級;若一個(gè)workflヽ(′▽?zhuān)?ノow可被一步解決,機器人需要補全的數ヽ(′?`)ノ據信息巨大,這是核心產(chǎn)品難點(diǎn);第一個(gè)關(guān)鍵點(diǎn),我們只要設身處地地想一下,就會(huì )發(fā)現:在不考慮語(yǔ)音識別準確率的前提下,任何事情我只要一個(gè)指令就可以達成。譬如“幫我叫個(gè)車(chē)”、“幫我交份外賣(mài)”、“幫我交一下水電費”、“幫我定一下出差的機票”,其他都不用管了,這種體驗簡(jiǎn)直贊爆了。
我們再看看第二個(gè)關(guān)鍵點(diǎn)。
就拿上面這個(gè)外賣(mài)的例子來(lái)看,如果用戶(hù)只需要一句“幫我叫個(gè)外賣(mài)”即可,那么機器人需要補全的信息至少包括“餐廳??”、“餐食”、“價(jià)格”、“送餐時(shí)間”、“送餐地點(diǎn)”、“支付信息”等,這些??信息中(zhong)的“送餐時(shí)間、送餐地點(diǎn)、支付信息”是相對靜態(tài)的信息,獲取一次就可長(cháng)期使用??墒恰安蛷d、餐食、價(jià)格”則是動(dòng)態(tài)信息ヽ(′▽?zhuān)?ノ,若想每次都可自┐(′д`)┌動(dòng)獲取,則代表機器人(ren)需要非常了解這位“主人用戶(hù)”才可以,否則只要有一兩次推薦偏差太大,體驗就會(huì )降低近乎一個(gè)量級。從本質(zhì)上來(lái)說(shuō),這時(shí)的助理機器人已是一款強大的推薦引擎,而且代表了極佳的魅力和美好的發(fā)展未來(lái)。
4.1.3 一個(gè)肯定:?jiǎn)?wèn)答機器人是很有價(jià)值的
最常見(jiàn)的問(wèn)答機器人是“客服機器人”,譬如京東的JIMI,阿里的小蜜機器人,還有一些銀行的客服機器人,但它們更像F(?⊿?)AQ過(guò)濾器。
我們細想一下阿里小蜜的使用場(chǎng)景。如果(???)我問(wèn)阿里小蜜“我的快遞怎么還沒(méi)送到?”,它的回復方式本質(zhì)是在常見(jiàn)的關(guān)于“快遞”的問(wèn)題中,把最常見(jiàn)的答案丟給我,比如它會(huì )告訴我“你的快遞已經(jīng)簽收了,如果沒(méi)收到可能是(′▽?zhuān)?)放到大門(mén)口了”。
如此,我們再回過(guò)頭來(lái)看看問(wèn)答機器人,它其實(shí)是在頭部問(wèn)題上實(shí)現了綜合過(guò)濾,然后通過(guò)對話(huà)的形式反饋給用戶(hù),如果用戶(hù)實(shí)在問(wèn)的是長(cháng)尾問(wèn)題,問(wèn)答機器人回答不了的,可以把問(wèn)題再拋給人工客服。滿(mǎn)足了用戶(hù)九成以上問(wèn)題的直接答復,是問(wèn)答機器??人的核心目標。而至于其他類(lèi)似導購、協(xié)助訂單管理等等,不過(guò)是附加在頭部問(wèn)題之上的增值體驗優(yōu)化。
4.2 對話(huà)機器人真的適合分為“聊天、助理、問(wèn)答”這三類(lèi)嗎?
這是一個(gè)目前業(yè)內比較慣用的分類(lèi),我們來(lái)看看這個(gè)分類(lèi)的視角。
如果站在技術(shù)視角來(lái)看,對話(huà)機器人應該分為“開(kāi)放域”和“封閉域”,這個(gè)我們已經(jīng)聊??過(guò)了,這里不再贅述。如果是站在用戶(hù)角色來(lái)看,對話(huà)機器人可能分為“教育版本”、“醫療版本”、??“二次元版本”等等。如果是站在業(yè)務(wù)視角來(lái)看,對話(huà)機器人可以分為純To C和To B再To C。所以,這種分類(lèi)更像是站在抽象場(chǎng)景視角來(lái)看的。幾乎任何場(chǎng)景都會(huì )被劃分到這三個(gè)類(lèi)別中,??要么無(wú)主題聊天,要么是任務(wù)導向,要么是提問(wèn)解答。其實(shí),倒過(guò)來(lái)看,幾乎ヽ(′▽?zhuān)?ノ所有我們已知的App也被這個(gè)分類(lèi)所覆蓋了。
可是??,對話(huà)機器人不是一個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的App,它是一個(gè)綜合體,直接這樣劃分并不是一個(gè)好的產(chǎn)品分類(lèi)。
你不會(huì )在淘寶里視頻聊天,更不會(huì )在支付寶里侃大山,百度幾年(′ω`)前試圖在大搜索中推出“直達號”去顛覆微信公眾號(hao),結果以失敗告終。
這個(gè)道理很簡(jiǎn)單:在移動(dòng)互聯(lián)網(wǎng)時(shí)代,幾乎每個(gè)App都有自己的專(zhuān)屬定位。有自己專(zhuān)屬的產(chǎn)品主路徑,不在自己路徑邏輯中的行為是不能順暢流轉的;每個(gè)App都像有自己的緊箍咒,不能輕易破除互??相之間的壁壘。??
如果ヾ(′▽?zhuān)??我們站在互聯(lián)網(wǎng)??整體產(chǎn)品世界里來(lái)看,其實(shí)我們每個(gè)人生活在一個(gè)混在的江湖社會(huì )中,手頭的各種工具幫我們實(shí)現一個(gè)個(gè)小任務(wù)目標,但是幾乎每一件小事都需要與人打交道,衣食住行無(wú)一例外。如果每一次與外界的接觸被看做一個(gè)流量的話(huà),那么最大的流量便是頻繁且無(wú)實(shí)際任務(wù)目的的人與人之間的交互,而相對較小的是去做一個(gè)個(gè)的具體任務(wù)事情:你會(huì )每天都見(jiàn)一些人,但你不會(huì )天天都買(mǎi)衣服。
幾乎所有的流量ヽ(′▽?zhuān)?ノ都是圍繞著(zhù)人與人之間的交互而形成的,而且你會(huì )發(fā)現一個(gè)規律:離現金流越近的流量,其活躍性越低,而且流失率越高。騰訊系的產(chǎn)品、百度的產(chǎn)品都是通過(guò)流量漏斗來(lái)多元變現的,而(er)阿里系的產(chǎn)(???)品,是直接拉人來(lái)買(mǎi)東西,盈利空間就直接建(╬ ò﹏ó)立在交易之上,需要不斷刺激人(◎_◎;)們買(mǎi)買(mǎi)買(mǎi)。
在所有的產(chǎn)品中,社交類(lèi)產(chǎn)品是最貼近“江湖社會(huì )(′?`*)”的,它距離現金流是最(/ω\)遠的,也是最活躍的,可以(′▽?zhuān)?)說(shuō)是幾乎所有互聯(lián)??網(wǎng)產(chǎn)品中活躍度最高,并且可以向任何產(chǎn)品導流ヾ(′▽?zhuān)??的源流量產(chǎn)品,所以你看到了,阿??里無(wú)所不用其極地想去做社交產(chǎn)品。
說(shuō)了一圈,那么我們回來(lái)看看社交產(chǎn)品的最(′_`)小雛形。
社交產(chǎn)(′-ι_-`)品分為即時(shí)社交和延時(shí)社交(jiao),簡(jiǎn)單類(lèi)比就┐(′?`)┌是聊天和朋友圈,而這兩個(gè)都是建立在“語(yǔ)言對話(huà)”的基礎上。由于社交產(chǎn)品的場(chǎng)景中幾乎可以做任何事情,前段時(shí)間網(wǎng)上流傳的微信“發(fā)現”頁(yè)面那張神圖,就可??見(jiàn)一斑。(°□°)
對話(huà)機器人具有社交產(chǎn)品的通性(xing),原因只有一個(gè)——對話(huà)機器人的交互場(chǎng)景天然就是一個(gè)社交產(chǎn)品(′?_?`)的交互場(chǎng)景。
當我(wo)們站在用戶(hù)視角來(lái)看待對話(huà)機器人時(shí),用戶(hù)根本不??理解什么是“開(kāi)放域、封閉域”,也不了解什么是“聊天機器人、助理機器人、問(wèn)答機器人”,用戶(hù)也記不住那些分類(lèi),也沒(méi)法記住,只要有一個(gè)對話(huà)輸入框擺在用戶(hù)面前,就像微信的輸入ヽ(′?`)ノ框那樣,由于知識詛咒的原因,用戶(hù)就會(huì )去類(lèi)比他所理解的對話(huà)輸入框,就會(huì )在這里輸入任何他們想輸入的自然語(yǔ)言,可能是瞎聊的話(huà),也可能是某個(gè)任務(wù),也可能是提一個(gè)問(wèn)題,我們根本不能阻止用戶(hù)在面對京東JIMI機器人時(shí)不做瞎聊的操作。
這(zhe)時(shí)帶來(lái)的一個(gè)巨大難題就是,開(kāi)放域對話(huà)會(huì )時(shí)有發(fā)生,而只要一次兩次回答不佳,體驗不滿(mǎn)就會(huì )提升。站在產(chǎn)品設計的角度來(lái)說(shuō),我們能做的就是(shi)盡量讓用戶(hù)的輸入是可控的,就像度秘、阿里小蜜已(′?_?`)經(jīng)在做的。這就是為什么,每當我們去設計對話(huà)機器人時(shí),總是要設法去多涉及一些開(kāi)放域對話(huà)的功能點(diǎn),也是為什么每當我們談起對話(huà)機器人時(shí),卻也總是繞不開(kāi)“機器人在開(kāi)放域下是不是智能”這個(gè)問(wèn)題。
4.3 像朋友一樣的伙伴會(huì )是對話(huà)機器人的終局嗎?
如果你在微信上,問(wèn)你最好的朋友“幫我看看有沒(méi)有戰狼2的票,我晚上想去看”,他/她會(huì )如何回答你?
我猜,他可能會(huì )說(shuō)“你去看《戰狼2》不叫我?!”,他可能還會(huì )說(shuō)“我也去,咱倆一塊兒去”,然后他會(huì )繼續說(shuō)“我看了下,你家跟前那家萬(wàn)達有票,晚上七點(diǎn)的,下班一塊兒去(╥_╥)?”
如果一樣的問(wèn)題問(wèn)Magic呢?它的回答就是讓你告訴他幾點(diǎn)去看,它幫你挑選了五家,每家的時(shí)間都挺合適,有一些距離你近,有些有優(yōu)惠,等等。
你喜歡哪種體驗呢?這個(gè)其實(shí)很難說(shuō)。如果站在封閉域的角度來(lái)說(shuō),Mヽ(′ー`)ノagic的算(???)法要比朋友優(yōu)很多,選擇也更豐富,可是和朋友一起去的這種體驗,才是生活。
我認為這個(gè)可能是對話(huà)機器人的??終局,它存在的意義仍然是協(xié)助人們去更好地解決一系列問(wèn)題;但是它不能太傻,像個(gè)指令機一樣待在那里,而是應該像個(gè)朋友一樣懂你卻也能幫你???。(T_T)以前在對話(huà)機器人產(chǎn)品的討論中還經(jīng)常討論:對話(huà)機器人應該更“有趣”還是更“有用”,其實(shí)從這個(gè)終局來(lái)看這個(gè)討┐(′д`)┌論毫無(wú)意義,你能說(shuō)你的朋友只有用,但是無(wú)(wu)趣嗎??
五、對話(huà)機器人的產(chǎn)品價(jià)值
對待產(chǎn)品ヾ(?■_■)ノ,一定要???從其商業(yè)視角出發(fā),不然沒(méi)有聊的意義。站在商業(yè)視角,對話(huà)機器人擁有三個(gè)方面(′_`)最核心的(de)產(chǎn)品價(jià)值。
由于對話(huà)機器人的交互方式原始??而單一,使得機器人背后所有的計算邏輯都被隱藏,機器人可以成為一個(gè)獨立的橋梁連接不同場(chǎng)景下的服務(wù),讓用戶(hù)只在一個(gè)對話(huà)場(chǎng)景下都可以完成交互。
譬如Skype for busiヾ(?■_■)ノnes???s中,就有??(′ω`)一個(gè)機器人,幫助通過(guò)S(′?`*)kype做協(xié)同的人們預定(′?`*)會(huì )議室、設置工作項目提??醒、代理自動(dòng)回復等等——原本每個(gè)工作都是跨場(chǎng)景的,現在只要一個(gè)對話(huà)交互場(chǎng)景就可以解決了。如果再往大了去說(shuō),??未來(lái)如果伙伴式的機器人可以逐漸出現,那在聊天中完成訂機票、訂酒店,甚至管理家里的智能空調,這些跨場(chǎng)景可能通過(guò)一個(gè)伙伴都ヽ(′ー`)ノ可以完成了。
5.2 交互升級帶來(lái)的(╯‵□′)╯流量深度沉淀
對話(huà)的方式有很多,可以是打字,也可以是語(yǔ)音。如果是語(yǔ)音,那么帶來(lái)的是革命性地變化。
5.2.1 指數級的流量增長(cháng)
百?度DuerOS和Amazon Alexa的邏輯是相似的,都是通過(guò)賦予所有智能硬件語(yǔ)音對話(huà)的能力,進(jìn)而獲取新流量,同時(shí)實(shí)現流量的深度交互和沉淀。
我們知道,在互聯(lián)網(wǎng)的生意經(jīng)中,一切都是圍繞著(zhù)流量來(lái)完成(′ω`)的,要么是流量足夠多,要么流量的價(jià)值足夠大。由于對話(huà)帶來(lái)的交互效率提升,使得在單個(gè)(ge)用??戶(hù)身上獲取的流量頻次呈現指數級增長(cháng),如果一般的互聯(lián)網(wǎng)產(chǎn)品PV/UV是個(gè)位數的話(huà),那么對話(huà)機器人的PV/UV(其實(shí)就是對話(huà)的頻次)至少是兩位數。
一些曾經(jīng)很難成為交互場(chǎng)景的(′ω`),譬如在家里面向Echo音箱發(fā)號施令,如今都通過(guò)對話(huà)機器人成為現實(shí)。沒(méi)有任何一款App能比??一個(gè)對話(huà)機器人更容易和人產(chǎn)生親密感,產(chǎn)生如此多高頻互動(dòng)的可能。最后的結果可(ke)能就是,我們的生活方方面面都在觸網(wǎng),每一次交互就是一次所謂的PV,指數級的流量映射出一個(gè)人生活的方??方面面。
5.2.2 高頻次的端計算
我有一個(gè)猜測:由于對話(huà)機器人是一個(gè)高頻次交互場(chǎng)景,帶來(lái)的最直??接影響可能是要求在設備端上擁有更加強大的計算能力;可能一些封閉域或ˉ\_(ツ)_/ˉ者開(kāi)放域的計算能力直接預加載到了客戶(hù)端,可能是硬件也可能是軟件。如果網(wǎng)絡(luò )能力不能同樣倍數增長(cháng)的話(huà),對于端的計算能力會(huì )增強——我猜這也是為什么一些AI企業(yè)會(huì )做芯片的原因之一。
5.3 流量沉淀帶來(lái)的數據深耕
正??是由于流量的深度沉淀,使得每個(gè)用戶(hù)多維的數據沉淀成為可能(neng)。當平均每個(gè)用戶(hù)(/ω\)的數據量和維度增長(cháng)十倍,那么到底意味著(zhù)什么呢?
對于(yu)百度而言,起碼廣告(′ω`)費要漲價(jià),對于阿里而言,可以賣(mài)給這個(gè)用戶(hù)更多的東西,總而言之,ARPU(Average Revenue per User)會(huì )增長(cháng)許多,這些就是最直接的商??業(yè)價(jià)值。我??在之前的文章《??人工智能「風(fēng)口」,先行者為什么是搜索引擎?》中,曾分析過(guò)這其中的一些邏輯關(guān)系,因為流量的深維度價(jià)值尚未被開(kāi)發(fā),對于計算廣告而言可(′?ω?`)能是(shi)一塊從未嘗鮮的處女地。
六、總結
如上是我針對對話(huà)機器人的一些比較淺顯的分析和探討,作為一款正在發(fā)展的新興產(chǎn)品,對話(huà)機器人還有非常多的細節值得探討;限于篇幅,只能先聊這么多了,希望以后還能繼續深入探討。
從個(gè)人層面來(lái)說(shuō),我看(kan)好T(′▽?zhuān)?o C的對話(huà)機器人產(chǎn)品的未來(lái)——但是它的(de)產(chǎn)品路徑非常曲折漫長(cháng),與我們過(guò)往所經(jīng)歷的移動(dòng)互聯(lián)網(wǎng)產(chǎn)品差??異巨大;但是萬(wàn)變不離其宗,任何產(chǎn)品都是從用戶(hù)的ヽ(′▽?zhuān)?ノ需求出??發(fā)的。
對話(huà)機器人承載了全新的交互形式┐(′?`)┌,可能帶來(lái)了全新的(╬ ò﹏ó)產(chǎn)品服務(wù)體驗,這種進(jìn)步過(guò)去從來(lái)沒(méi)有過(guò)。
我們每個(gè)人幾乎都在渴望著(zhù)機器人時(shí)代的到來(lái),也許???很遙遠,也許已經(jīng)在路上,誰(shuí)知道呢~
