為什么亞馬遜虛擬助手 Alexa 的會話功能如此難以實現(xiàn)

來源: 百家號
作者:Price評論
時間:2020-09-29
17457
即使經(jīng)過多年的練習,人類也很難理解對話中的來來回回和細微差別ーー我們總是互相打斷對方,誤解事情的來龍去脈,有時不得不重復自己說的話來準確傳達信息。

即使經(jīng)過多年的練習,人類也很難理解對話中的來來回回和細微差別ーー我們總是互相打斷對方,誤解事情的來龍去脈,有時不得不重復自己說的話來準確傳達信息?,F(xiàn)在想象一下,對于人工智能來說,目前即使在最好的狀態(tài)下,它們的溝通能力還是遠遠不如我們?nèi)祟?,要想弄清楚所有說話的藝術(shù),并在適當?shù)臅r機加以權(quán)衡,會有多么困難。

e1fe9925bc315c605569691e275992144b5477b6.jpeg

這正是亞馬遜(Amazon)正在嘗試為其Alexa虛擬助手開發(fā)新功能所撞到的技術(shù)墻。亞馬遜在周四推出了這項新功能,預計明年正式發(fā)布,這個新功能將允許Alexa的用戶在多人討論中加入普通人的談話,并且權(quán)衡語境給出正確的建議。這與我們通常單獨地通過語音助理進行交互的方式非常不同,亞馬遜稱之為一種溝通“技能”,智能音響和其他使用虛擬助手的設(shè)備將會是新版Alexa的主戰(zhàn)場。

亞馬遜在周四的活動期間分享了一段視頻,展示了自己對于新版Alexa的使用場景的構(gòu)想。兩名女子與Alexa一起協(xié)調(diào)商量如何訂購一份披薩,這個視頻內(nèi)容體現(xiàn)在(Amazon Echo Show)這個小工具上。兩個女性參與者同時和Alexa進行語音互動,有時她們談?wù)撨@件事,有時直接談?wù)撃羌?。當Alexa選擇了首選的披薩配料組合,以及在決定了披薩訂單之后詢問兩人吃披薩的時候想看什么樣的電影。盡管她們提出了一些可以互相交流的問題,比如“你認為一部電影就足夠了嗎?”和“這是一部好電影嗎?”Alexa似乎都能正確地分辨出哪些問題是針對人類的,哪些問題是針對人工智能系統(tǒng)自身的,簡直就像一個真正的成年人在和她們溝通。

其實Alexa和真人之間的這種類似人類的互動并不容易達到完美的境地,亞馬遜已經(jīng)為此努力了很長一段時間。今年7月,亞馬遜展示了Alexa Conversations的早期版本,該版本旨在幫助Alexa技能開發(fā)人員創(chuàng)建更多類似人類的對話功能。一年多前,亞馬遜(Amazon)提出了這樣一個想法,即將電影票、餐館預訂和搭車等幾個要求組合成Alexa和一個人之間的單一對話(這一功能于今年1月推出)。

亞馬遜上周四展示的這種可以用于多人交談的話題轉(zhuǎn)換,標志著Alexa下一步將成為一個有討論溝通能力的伙伴。

亞馬遜公司副總裁兼首席科學家羅希特·普拉薩德說,要讓Alexa有能力參與聽起來自然的話題轉(zhuǎn)換需要一些步驟和信號識別。首先,Alexa必須檢測語音;然后,它必須弄清楚這個人在說什么,以及這個語音是否實際上是針對Alexa的ーー這比一個典型的一對一的語音互動更難,因為在這種情況下,只有當你邀請Alexa參與談話時,你才能直接對它說話。新版的Alexa必須保持跟蹤歷史對話內(nèi)容,以了解有些話的內(nèi)在含義。

普拉薩德說,如果能讓Alexa在一個帶攝像頭的設(shè)備上運行,就像亞馬遜的Echo Show一樣,而且Alexa獲得了采用攝像頭的許可,那么它就會利用這一點作為一個額外的信號識別:攝像頭可以用來記錄說話者的姿勢,以確定這個人是在和Alexa說話還是和房間里的其他人說話。

在未來,Alexa也可以打斷你的發(fā)言。如果,比如說,一個關(guān)于買披薩或者看電影的談話變成了一場無休止的爭論,這個時候Alexa就可以幫大家冷靜下來。

“但是打斷別人說話的時候,時機和語氣必須是正確的,否則會讓使用者更加難以冷靜?!?/span>

立即登錄,閱讀全文
版權(quán)說明:
本文內(nèi)容來自于百家號,本站不擁有所有權(quán),不承擔相關(guān)法律責任。文章內(nèi)容系作者個人觀點,不代表快出海對觀點贊同或支持。如有侵權(quán),請聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多