由周四發(fā)布的“網(wǎng)絡(luò)垃圾”(Webspam)報(bào)告可知,谷歌搜索在2021年過(guò)濾的垃圾網(wǎng)站數(shù)量、竟是2020年的六倍。據(jù)悉,作為Alphabet旗下子公司,Google有一套名為SpamBrian的人工智能垃圾過(guò)濾系統(tǒng),并且可在超過(guò)99%情況下實(shí)現(xiàn)“不受垃圾所困擾”(spam-free)的搜索體驗(yàn)。
(來(lái)自:Google Search Central Blog)
此前,SpamBrain已被這家搜索巨頭用于防止用戶點(diǎn)擊那些可能被注入了惡意軟件的有害網(wǎng)站、或旨在誘騙人們泄露個(gè)人信息/匯款的詐騙站點(diǎn)。
Google表示,鑒于垃圾信息散播者在持續(xù)不斷地找到繞過(guò)過(guò)濾機(jī)制的方法,基于人工智能的篩查系統(tǒng)也是相當(dāng)必要的。
需要指出的是,搜索是Google的重要收入來(lái)源之一。而高質(zhì)量和安全的網(wǎng)站搜索結(jié)果,也對(duì)該公司來(lái)說(shuō)至關(guān)重要。
經(jīng)過(guò)多年摸索,垃圾網(wǎng)站制作方早已精通搜索引擎優(yōu)化(SEO)技術(shù),來(lái)人為地提升其搜索排名。
作為應(yīng)對(duì),Google也迫切需要排除掉那些利用欺詐算法的垃圾網(wǎng)站。
截至目前,Google已借助SpamBrain將垃圾站點(diǎn)砍掉70%,其中包括被黑客入侵并植入有害代碼的感染站點(diǎn)。若被其得逞,受害者將被竊取登錄憑據(jù)等機(jī)密信息。
其它類型的垃圾站點(diǎn),還涉及將惡意軟件注入受害者的計(jì)算機(jī)、或誘導(dǎo)重定向至惡意站點(diǎn)。慶幸的是,Google聲稱SpamBrain能夠?qū)⑦@類害群之馬排除在搜索結(jié)果之外。
Google政策溝通經(jīng)理Ned Adriance在一封電子郵件中提到:
欺詐者經(jīng)常拙劣地模仿其它網(wǎng)站,常見(jiàn)套路是填充替換關(guān)鍵詞、假借品牌徽標(biāo)、并附上想要引誘受害者撥打的電話號(hào)碼。
而Google的SpamBrain算法方案,能夠基本上確保此類欺詐型站點(diǎn)出現(xiàn)在相關(guān)搜索結(jié)果頁(yè)面中,且過(guò)濾了75%的亂碼垃圾站點(diǎn)。
這些垃圾站點(diǎn)往往在一堆無(wú)意義的文本中填充大量關(guān)鍵詞,以試圖提升其搜索排名。有時(shí)甚至?xí)义X掛上垃圾鏈接,來(lái)誘騙搜索引擎的爬蟲(chóng)和抬升PageRank品質(zhì)評(píng)分。
對(duì)于用戶來(lái)說(shuō),時(shí)間總是相當(dāng)寶貴的。而Google的各種解決方案,就希望為用戶帶來(lái)更好的內(nèi)容檢索體驗(yàn)。
【背景資料】
Google于2018年推出的SpamBrain系統(tǒng),且與近20年前剛開(kāi)始治理惡意網(wǎng)站時(shí)相比,去年搜索過(guò)濾的垃圾站點(diǎn)數(shù)量已暴增200倍。
即便如此,這場(chǎng)“道高一尺魔高一丈”的垃圾信息攻防戰(zhàn),顯然不會(huì)輕易完結(jié)。