“還差1人開(kāi)局,你來(lái)不來(lái)?”“啥,陪對(duì)象呢?!”
“不是,這人怎么進(jìn)房間就走了??!”
“又是個(gè)掛機(jī)的,服了,下把直接ttt!”
社交策略類(lèi)游戲最怕遇到上面的情景,要么少人游戲永遠(yuǎn)無(wú)法開(kāi)局,要么有人掛機(jī)影響游戲體驗(yàn)。不慌,有AI就行,這局要么穩(wěn)贏(yíng),要么過(guò)癮!
隨著AIGC在泛娛樂(lè)領(lǐng)域應(yīng)用的逐漸深入,現(xiàn)階段不少游戲場(chǎng)景中都加入了AI NPC的角色。AI NPC可以為玩家提供各種任務(wù)和對(duì)話(huà),不僅能夠幫助玩家擺脫游戲人數(shù)的硬性限制,很好地參與其中,成為合格的游戲搭子,還能通過(guò)其智能行為和反應(yīng)為游戲增加更多的挑戰(zhàn)性和互動(dòng)性,讓游戲更刺激。
早于今年5月,聲網(wǎng)就推出了AI+誰(shuí)是臥底的玩法,由AI來(lái)充當(dāng)其中一名玩家,在游戲中學(xué)習(xí)、提煉其他玩家的發(fā)言格式,對(duì)自己的關(guān)鍵詞進(jìn)行描述發(fā)言,并能通過(guò)分析其他玩家的發(fā)言,做出“誰(shuí)是臥底”的判斷并進(jìn)行投票。此類(lèi)AI對(duì)話(huà)游戲?qū)ι舷挛南?shù)的支持需要用到大模型token能力,像狼人殺、誰(shuí)是臥底這種人數(shù)多、回合多且發(fā)言多的游戲,對(duì)token能力有很高的要求,而聲網(wǎng)已經(jīng)選型集成的大模型能夠很好地支持游戲的順暢推進(jìn)。
此外,聲網(wǎng)AIGC解決方案能夠支持各類(lèi)AI+音視頻互動(dòng)場(chǎng)景,除了上面提到的AI+誰(shuí)是臥底玩法,聲網(wǎng)還能夠提供AI版本的海龜湯和你說(shuō)我猜玩法,企業(yè)也可以根據(jù)實(shí)際需求定制玩法,持續(xù)挖掘AI NPC在社交游戲場(chǎng)景中的更多應(yīng)用潛力。在海龜湯游戲中,AI將充當(dāng)出題者,提出一個(gè)難以理解的事件,玩家可以提出任何問(wèn)題以縮小范圍并找出事件背后真正的原因,但出題者(AI)僅能以“是(對(duì))”、“不是(不對(duì))”或“沒(méi)有關(guān)系”來(lái)作答。當(dāng)玩家收集到足夠的信息,能夠描述出完整故事時(shí),AI便會(huì)對(duì)玩家的最終答案進(jìn)行判斷,并宣布游戲結(jié)果。
在你說(shuō)我猜游戲中,AI將充當(dāng)出題人,設(shè)置一個(gè)游戲謎底并根據(jù)玩家的描述給予“是”與“不是”的回復(fù),直至玩家給出正確答案。此類(lèi)小游戲,特別適合語(yǔ)聊房、陌生人交友等線(xiàn)上社交場(chǎng)景,起到迅速破冰的效果,為平臺(tái)帶來(lái)一定增益。
游戲社交此類(lèi)場(chǎng)景對(duì)互動(dòng)實(shí)時(shí)性要求極高,市面上已有的方案要么是離線(xiàn)的本地?cái)?shù)字人方案,要么是全鏈路延時(shí)過(guò)高(6-7s)無(wú)法滿(mǎn)足游戲中的實(shí)時(shí)互動(dòng),影響用戶(hù)體驗(yàn)。而聲網(wǎng)更專(zhuān)注于提供實(shí)時(shí)音頻對(duì)話(huà)的更優(yōu)體驗(yàn),低延時(shí)、更沉浸。
更沉浸,用戶(hù)體驗(yàn)拉滿(mǎn)
實(shí)時(shí)音視頻互動(dòng)相比輸入文字,操作更便捷,且能夠與其它多模態(tài)互動(dòng)方式結(jié)合,提升用戶(hù)體驗(yàn)。聲網(wǎng)提供的實(shí)時(shí)音視頻+實(shí)時(shí)消息+虛擬形象方案能夠帶來(lái)更真實(shí)自然的互動(dòng)體驗(yàn),更好地表達(dá)情感和傳達(dá)用戶(hù)的個(gè)性化意圖。
響應(yīng)延時(shí)低至1.9秒內(nèi)
針對(duì)目前市面上大多數(shù)AI生成式對(duì)話(huà)響應(yīng)慢的問(wèn)題,聲網(wǎng)對(duì)AIGC場(chǎng)景下音視頻互動(dòng)的延時(shí)做了很多技術(shù)優(yōu)化,從用戶(hù)發(fā)言到AI對(duì)話(huà)響應(yīng)平均延時(shí)僅為1.9s,而市場(chǎng)上絕大部分AI互動(dòng)延遲還停留在6-7s。
3h快速上線(xiàn),節(jié)省開(kāi)發(fā)時(shí)間
在場(chǎng)景開(kāi)發(fā)層面,聲網(wǎng)提供封裝完整的SDK,包含實(shí)時(shí)音視頻、實(shí)時(shí)消息、語(yǔ)音轉(zhuǎn)文字(STT)/文字轉(zhuǎn)語(yǔ)音(TTS)、語(yǔ)音驅(qū)動(dòng)虛擬人嘴型等多種能力,并支持API快速調(diào)用,提供開(kāi)箱即用的場(chǎng)景化Demo,最快3h即可實(shí)現(xiàn)方案快速驗(yàn)證。尤其對(duì)于想快速驗(yàn)證新場(chǎng)景的企業(yè)與開(kāi)發(fā)者而言,可以節(jié)省很多開(kāi)發(fā)時(shí)間。
此外,聲網(wǎng)還可以提供以下RTE X AIGC一站式產(chǎn)品能力:
1.國(guó)內(nèi)外多種商用大模型靈活切換
聲網(wǎng)與熱門(mén)的國(guó)內(nèi)外大模型廠(chǎng)商進(jìn)行合作,支持企業(yè)根據(jù)自身需求進(jìn)行靈活切換。此外,聲網(wǎng)在開(kāi)源大模型層面也有在嘗試做私有化部署,以滿(mǎn)足部分企業(yè)對(duì)數(shù)據(jù)安全及網(wǎng)絡(luò)的要求。
2.支持豐富的語(yǔ)言能力
對(duì)STT+TTS模型精細(xì)化調(diào)優(yōu),實(shí)現(xiàn)人聲分離,斷句優(yōu)化,讓整個(gè)語(yǔ)言體驗(yàn)更加流暢。此外,聲網(wǎng)還支持AI實(shí)時(shí)變聲、定制化聲音克隆,讓聲音聽(tīng)起來(lái)更具真實(shí)感。
3.場(chǎng)景人設(shè)定制化
聲網(wǎng)在1V1語(yǔ)音、多人語(yǔ)音、視頻直播等場(chǎng)景還對(duì)AI角色進(jìn)行了人設(shè)定制,通過(guò)Prompt的方式設(shè)置AI角色的名字、職業(yè)、性格等豐富的人設(shè)屬性并支持定制形象與聲音。例如在誰(shuí)是臥底、海龜湯等多人游戲的場(chǎng)景中,AI可以作為一個(gè)玩家角色參與到游戲中。
4.多輪對(duì)話(huà)記憶,交互體驗(yàn)再升級(jí)
聲網(wǎng)提供多輪對(duì)話(huà)記憶功能,對(duì)于需要AI精準(zhǔn)回答特定行業(yè)知識(shí)、企業(yè)專(zhuān)業(yè)知識(shí)、多維度知識(shí)的客戶(hù),聲網(wǎng)AIGC解決方案都可以給予響應(yīng)。比如誰(shuí)是臥底游戲中的AI NPC既可以充當(dāng)臥底又可以扮演隊(duì)友,響應(yīng)敏捷。