每天有數(shù)百萬(wàn)的人在各種Yandex服務(wù)平臺(tái)看到廣告。廣告商僅可以針對(duì)符合其廣告的用戶展示廣告——例如,針對(duì)特定年齡或行為習(xí)慣的用戶。為了能夠識(shí)別不同的受眾群體Yandex開(kāi)發(fā)了Crypta技術(shù)。該技術(shù)會(huì)根據(jù)用戶網(wǎng)絡(luò)行為習(xí)慣識(shí)別不同的用戶群體。
工作原理
Crypta技術(shù)基于MatrixNet機(jī)器學(xué)習(xí)方法。通過(guò)研究典型用戶的網(wǎng)絡(luò)行為,Crypta技術(shù)學(xué)習(xí)識(shí)別受眾群體。為保證學(xué)習(xí)成效,技術(shù)需要分析至少3萬(wàn)用戶的行為。據(jù)測(cè)驗(yàn)結(jié)果顯示,這種數(shù)量已經(jīng)足夠保證可靠的學(xué)習(xí)結(jié)果。
通過(guò)市場(chǎng)調(diào)查公司Yandex尋找屬于某種群體的典型用戶。市場(chǎng)調(diào)查公司幫助尋找具有需要社會(huì)人口特征的人,即具有固定性別、年齡、收入與教育水平、生活習(xí)慣與興趣的人。比如,如果需要讓Crypta學(xué)會(huì)識(shí)別寵物食品的購(gòu)買(mǎi)者,可以通過(guò)社會(huì)調(diào)查找到這些用戶。當(dāng)然,Yandex以匿名形式獲得調(diào)查數(shù)據(jù)。
之后,Crypta分析典型用戶的網(wǎng)絡(luò)行為:在搜索查詢使用哪些詞語(yǔ)、在用戶會(huì)話中提交多少查詢串、訪問(wèn)哪些網(wǎng)站、在什么時(shí)間上網(wǎng)等等。Crypta一共分析300左右種描述用戶行為的因素以及確定每個(gè)因素對(duì)具體用戶群體的重要性。終于Crypta建立用戶識(shí)別公式,并確認(rèn)用戶是否歸于固定的用戶群體。公式建立以后,再次把它應(yīng)用于新一批數(shù)據(jù),如有需要對(duì)公式進(jìn)行調(diào)整。
Crypta計(jì)算每位網(wǎng)絡(luò)用戶對(duì)某種用戶群體的歸屬可能性。為了能夠反映人們的興趣變化,這些數(shù)據(jù)每天重新計(jì)算。比如,為了用戶從一個(gè)年齡群體轉(zhuǎn)到另一個(gè)年齡群體需要較長(zhǎng)的時(shí)間,但是他能很快進(jìn)入汽車(chē)愛(ài)好者群體。
使用范圍
Crypta使用于Yandex的關(guān)鍵詞廣告與橫幅廣告。比如,Yandex網(wǎng)絡(luò)聯(lián)盟平臺(tái)中展示的關(guān)鍵詞廣告的挑選過(guò)程也基于Crypta技術(shù)的社會(huì)人口數(shù)據(jù)。
在橫幅廣告使用Crypta以針對(duì)固定性別和年齡的用戶或針對(duì)電視輕度使用者展示廣告。Look-alike社會(huì)人口定向也基于Crypta技術(shù),該定向允許廣告商尋找與現(xiàn)有客戶相似的用戶以及向他們展示橫幅廣告。