Adjust|機(jī)器學(xué)習(xí)是對(duì)抗作弊的解藥?:CTO 談移動(dòng)作弊理論 III

來(lái)源: Adjust
作者:Paul Müller
時(shí)間:2021-01-21
17083
機(jī)器學(xué)習(xí)是我們對(duì)抗移動(dòng)廣告作弊的解藥?

機(jī)器學(xué)習(xí)是我們對(duì)抗移動(dòng)廣告作弊的解藥?

可以肯定的是,機(jī)器學(xué)習(xí)對(duì)于我們處理作弊的方式有很大的影響。隨著其不斷地被開(kāi)發(fā)應(yīng)用,機(jī)器學(xué)習(xí)開(kāi)發(fā)在業(yè)界取得了巨大進(jìn)展。然而,機(jī)器學(xué)習(xí)并非萬(wàn)無(wú)一失的解決方案,就技術(shù)層面而言,仍存在著許多未臻完善的缺點(diǎn)。

我們目前仍然處于機(jī)器學(xué)習(xí)使用的早期階段。因此,放手讓它打擊作弊是不負(fù)責(zé)任的行為,并可能導(dǎo)致意想不到的后果。

在接下來(lái)的移動(dòng)作弊理論系列III中,我們將探討機(jī)器學(xué)習(xí),了解該技術(shù)適用于市場(chǎng)的侷限性,以及該如何善用它目前的架構(gòu),使其確實(shí)達(dá)成我們的核心目的。如果您尚未閱讀此理論系列,請(qǐng)點(diǎn)擊此處從第1部分開(kāi)始閱讀,您也跳過(guò)第1部分,在第2部分了解作弊檢測(cè)和預(yù)防作弊之間的差異。

區(qū)隔理論與實(shí)際應(yīng)用

從目前的情況來(lái)看,機(jī)器學(xué)習(xí)存在根本上的理論問(wèn)題,隨后我們將通過(guò)類比進(jìn)行說(shuō)明。假設(shè)您想要從河中汲水喝,水受到不同來(lái)源的嚴(yán)重污染,種種跡象顯示有問(wèn)題發(fā)生。因此,您決定先確認(rèn)水是否安全,然后考慮去除所有潛在污染物的方法。這意味著,您不僅需要明白污染物究竟看起來(lái)如何,還需要想出過(guò)濾所有污染物的對(duì)策。

在克服困難之后,您打造出一臺(tái)先進(jìn)的機(jī)器。它自學(xué)如何檢測(cè)潛在的問(wèn)題跡象,還會(huì)提示您它發(fā)現(xiàn)了哪種污染物。

實(shí)踐表明,您的機(jī)器能夠準(zhǔn)確分辨出它發(fā)現(xiàn)的污染物類型,尤其是隨著時(shí)間推移,檢測(cè)的次數(shù)越多,其準(zhǔn)確率也越高。但是,這是否意味著它能檢測(cè)出每一種類型的污染物?同時(shí),是否可以用它來(lái)阻止污染,并過(guò)濾出安全的飲用水?

機(jī)器學(xué)習(xí)存在的隱憂

如果我們嘗試將機(jī)器學(xué)習(xí)取代具體的方法來(lái)過(guò)濾偽造行為,諸多問(wèn)題可能會(huì)隨之而生。由于我們必須從真實(shí)用戶的組合數(shù)據(jù)集中過(guò)濾出虛假用戶,在過(guò)濾的過(guò)程中,會(huì)產(chǎn)生大量不明確的邊緣案例(edge cases)。

此外,作弊者可以“培養(yǎng)”來(lái)自真實(shí)設(shè)備的數(shù)據(jù),偽造合法的用戶行為,其中包括SDK發(fā)送的任何歸因。有些作弊者會(huì)犯錯(cuò)(例如創(chuàng)建容易被發(fā)現(xiàn)的虛假用戶交互),每一次被發(fā)現(xiàn)他們便學(xué)到一些新東西。因此,他們下一次的作弊嘗試可能會(huì)更加復(fù)雜。

我們舉個(gè)例子來(lái)說(shuō)明機(jī)器學(xué)習(xí)目前所面臨的困難。比方說(shuō),作弊者使用已知用戶的真實(shí)設(shè)備信息(例如操作系統(tǒng)版本、IDFA和區(qū)域設(shè)置)來(lái)實(shí)施作弊,問(wèn)題是,在這種設(shè)備上就從未被下載的應(yīng)用進(jìn)行偽造安裝,會(huì)導(dǎo)致機(jī)器學(xué)習(xí)算法在提取過(guò)去的數(shù)據(jù)點(diǎn)時(shí),難以正確地為作弊手法作分類。其原因在于,歷史數(shù)據(jù)表明用戶是真實(shí)的,如此一來(lái),又怎么使算法認(rèn)為這是作弊呢?

此外,肇因于這些濫用真實(shí)設(shè)備數(shù)據(jù)的拙劣偽造行為,日后真正的用戶活動(dòng)可能反而被歸類為作弊。本質(zhì)上而言,機(jī)器學(xué)習(xí)不知道哪個(gè)數(shù)據(jù)點(diǎn)是真實(shí)的,哪個(gè)數(shù)據(jù)點(diǎn)又是偽造的,繼而造成神經(jīng)網(wǎng)絡(luò)訓(xùn)練的困難。我們已經(jīng)看到,作弊者用“完美”的數(shù)據(jù)偽造了幾乎所有的請(qǐng)求,其中包括客戶自身的測(cè)量系統(tǒng)。這使得機(jī)器學(xué)習(xí)即便在進(jìn)行長(zhǎng)期跟蹤之后,也很難辨識(shí)偽造用戶。

簡(jiǎn)而言之,當(dāng)面對(duì)不熟悉的新場(chǎng)景時(shí),機(jī)器學(xué)習(xí)無(wú)法有效發(fā)揮作用。在下一部分我們將解釋,為何機(jī)器學(xué)習(xí)在實(shí)際應(yīng)用中,還不足以作為一個(gè)可靠的測(cè)量和過(guò)濾系統(tǒng)。

在轉(zhuǎn)化中迷失的數(shù)據(jù)

要作為拒絕假量的判斷基礎(chǔ),神經(jīng)網(wǎng)絡(luò)需要在安裝時(shí)便決定何時(shí)要為大多數(shù)的營(yíng)銷活動(dòng)付款,然而此時(shí)它對(duì)用戶知之甚少。

為了解決這一問(wèn)題,同時(shí)確定用戶的合法性,機(jī)器學(xué)習(xí)會(huì)嘗試在更大的數(shù)據(jù)集內(nèi)檢測(cè)更復(fù)雜的規(guī)律模式,包括那些看來(lái)混沌不明的特征。

這個(gè)時(shí)候,如果嘗試弄清楚整個(gè)專用神經(jīng)網(wǎng)絡(luò)的決策過(guò)程,您可能被搞得焦頭爛額。機(jī)器學(xué)習(xí)會(huì)創(chuàng)建出極其復(fù)雜的規(guī)則集,以奇怪的組合方式識(shí)別看似不相關(guān)的標(biāo)識(shí)符。

有些供應(yīng)商銷售的反作弊工具十分依賴機(jī)器學(xué)習(xí)作為拒絕的基礎(chǔ),如果受到質(zhì)疑,這些供應(yīng)商可能會(huì)決定將他們的決策隱藏在黑箱(black box)內(nèi)。也就是說(shuō),永遠(yuǎn)不解釋他們?cè)谧鍪裁础?/p>

這可能成為未來(lái)防作弊工具的一大隱憂。

為什么說(shuō)黑箱不是一個(gè)好主意?

黑箱真的有那么糟糕嗎?讓我們舉個(gè)例子來(lái)說(shuō)明原因。

假設(shè)有個(gè)渠道正在就近期營(yíng)銷活動(dòng)中被拒絕的歸因與客戶調(diào)解糾紛。渠道沒(méi)有可以復(fù)制或解釋拒絕的數(shù)據(jù),因此不得不依據(jù)客戶的表述,而客戶又依賴于監(jiān)控作弊的歸因服務(wù)。雖然小部分爭(zhēng)議流量對(duì)于渠道來(lái)說(shuō)可能不成問(wèn)題,但在達(dá)到一定的臨界值之后,它會(huì)變成一個(gè)大問(wèn)題。

一旦供應(yīng)商失去解釋拒絕歸因的能力(或者不想解釋),客戶會(huì)提出意見(jiàn)性的主張。我們可以就意見(jiàn)作爭(zhēng)辯或提出異議,然而如果沿著這個(gè)方向發(fā)展,最終會(huì)演變成這樣的景況:渠道試圖把每個(gè)過(guò)濾器描述成另一種可忽略的意見(jiàn)。

對(duì)于有效過(guò)濾的構(gòu)成要素,我們已經(jīng)清楚地表達(dá)了我們的觀點(diǎn)。我們想要?jiǎng)?chuàng)建一個(gè)合乎邏輯且透明的系統(tǒng),以回避意見(jiàn)性的爭(zhēng)端,也就是說(shuō),我們嘗試以合乎事實(shí)的方式主張我們的拒絕。

正因如此,盡管我們認(rèn)為機(jī)器學(xué)習(xí)是種優(yōu)秀的檢測(cè)手段,但我們不應(yīng)該用它進(jìn)行拒絕,至少現(xiàn)在還不能。在目前的狀態(tài)下,邊緣案例會(huì)被忽略,且決策背后的邏輯最終可能會(huì)因意見(jiàn)而被拒絕,進(jìn)而引發(fā)缺乏透明度的問(wèn)題。我們應(yīng)該要做的,是認(rèn)真研究、在正確的基礎(chǔ)上構(gòu)建過(guò)濾器,從而在不拒絕合法來(lái)源安裝的情況下阻止作弊。

現(xiàn)在讓我們回頭思考上文有關(guān)機(jī)器學(xué)習(xí)的類比,您肯定知道污染是存在的。但這并不意味著用這項(xiàng)邏輯來(lái)過(guò)濾水源的時(shí)機(jī)已經(jīng)成熟。最好的辦法是什么?通過(guò)研究調(diào)查和適當(dāng)?shù)倪^(guò)濾,您可以追溯上游,找到污染來(lái)源,并從根本源頭杜絕污染。

立即登錄,閱讀全文
版權(quán)說(shuō)明:
本文內(nèi)容來(lái)自于Adjust,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
Adjust 2025年移動(dòng)應(yīng)用行業(yè)六大趨勢(shì)預(yù)測(cè)
Adjust 2025年移動(dòng)應(yīng)用行業(yè)六大趨勢(shì)預(yù)測(cè)
科技快速發(fā)展,AI與ML迅速滲透各行業(yè),企業(yè)思考如何利用AI打造競(jìng)爭(zhēng)力產(chǎn)品、精準(zhǔn)營(yíng)銷策略及多元化營(yíng)銷監(jiān)測(cè)方案。
海外營(yíng)銷
移動(dòng)營(yíng)銷
2024-12-302024-12-30
玩轉(zhuǎn)深度鏈接,實(shí)現(xiàn)零摩擦轉(zhuǎn)化:四個(gè)打造流暢客戶體驗(yàn)的真實(shí)案例
玩轉(zhuǎn)深度鏈接,實(shí)現(xiàn)零摩擦轉(zhuǎn)化:四個(gè)打造流暢客戶體驗(yàn)的真實(shí)案例
當(dāng)下,應(yīng)用的轉(zhuǎn)化路徑往往會(huì)覆蓋多個(gè)平臺(tái)、設(shè)備和觸點(diǎn),復(fù)雜性越來(lái)越高。
Applovin
海外營(yíng)銷
海外推廣
2024-12-282024-12-28
Adjust發(fā)布《2024年購(gòu)物應(yīng)用洞察報(bào)告》讀懂購(gòu)物季營(yíng)銷
Adjust發(fā)布《2024年購(gòu)物應(yīng)用洞察報(bào)告》讀懂購(gòu)物季營(yíng)銷
領(lǐng)先的監(jiān)測(cè)和數(shù)據(jù)分析公司Adjust于14日發(fā)布《2024年購(gòu)物應(yīng)用洞察報(bào)告》。報(bào)告旨在幫助移動(dòng)營(yíng)銷人員完美備戰(zhàn)2024年第四季度購(gòu)物季,并為2025年做好充分的準(zhǔn)備。
Adjust
數(shù)據(jù)分析
應(yīng)用
移動(dòng)監(jiān)測(cè)
2024-11-152024-11-15
Google安卓端隱私沙盒術(shù)語(yǔ)全解
Google安卓端隱私沙盒術(shù)語(yǔ)全解
在當(dāng)前以隱私保護(hù)為核心的生態(tài)中,隨時(shí)做好準(zhǔn)備,靈活適應(yīng)變更至關(guān)重要。
Adjust
Android
谷歌
2024-11-022024-11-02
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家