每天有數(shù)百萬的人在各種Yandex服務(wù)平臺看到廣告。廣告商僅可以針對符合其廣告的用戶展示廣告——例如,針對特定年齡或行為習(xí)慣的用戶。為了能夠識別不同的受眾群體Yandex開發(fā)了Crypta技術(shù)。該技術(shù)會根據(jù)用戶網(wǎng)絡(luò)行為習(xí)慣識別不同的用戶群體。
工作原理
Crypta技術(shù)基于MatrixNet機(jī)器學(xué)習(xí)方法。通過研究典型用戶的網(wǎng)絡(luò)行為,Crypta技術(shù)學(xué)習(xí)識別受眾群體。為保證學(xué)習(xí)成效,技術(shù)需要分析至少3萬用戶的行為。據(jù)測驗結(jié)果顯示,這種數(shù)量已經(jīng)足夠保證可靠的學(xué)習(xí)結(jié)果。
通過市場調(diào)查公司Yandex尋找屬于某種群體的典型用戶。市場調(diào)查公司幫助尋找具有需要社會人口特征的人,即具有固定性別、年齡、收入與教育水平、生活習(xí)慣與興趣的人。比如,如果需要讓Crypta學(xué)會識別寵物食品的購買者,可以通過社會調(diào)查找到這些用戶。當(dāng)然,Yandex以匿名形式獲得調(diào)查數(shù)據(jù)。
之后,Crypta分析典型用戶的網(wǎng)絡(luò)行為:在搜索查詢使用哪些詞語、在用戶會話中提交多少查詢串、訪問哪些網(wǎng)站、在什么時間上網(wǎng)等等。Crypta一共分析300左右種描述用戶行為的因素以及確定每個因素對具體用戶群體的重要性。終于Crypta建立用戶識別公式,并確認(rèn)用戶是否歸于固定的用戶群體。公式建立以后,再次把它應(yīng)用于新一批數(shù)據(jù),如有需要對公式進(jìn)行調(diào)整。
Crypta計算每位網(wǎng)絡(luò)用戶對某種用戶群體的歸屬可能性。為了能夠反映人們的興趣變化,這些數(shù)據(jù)每天重新計算。比如,為了用戶從一個年齡群體轉(zhuǎn)到另一個年齡群體需要較長的時間,但是他能很快進(jìn)入汽車愛好者群體。
使用范圍
Crypta使用于Yandex的關(guān)鍵詞廣告與橫幅廣告。比如,Yandex網(wǎng)絡(luò)聯(lián)盟平臺中展示的關(guān)鍵詞廣告的挑選過程也基于Crypta技術(shù)的社會人口數(shù)據(jù)。
在橫幅廣告使用Crypta以針對固定性別和年齡的用戶或針對電視輕度使用者展示廣告。Look-alike社會人口定向也基于Crypta技術(shù),該定向允許廣告商尋找與現(xiàn)有客戶相似的用戶以及向他們展示橫幅廣告。