在facebook中為什么我朋友的好友總比我多?

來源:騰訊科技
作者:中科院物理所
時(shí)間:2020-07-06
2685
2011年5月,有兩位博士生—約翰·尤甘德(Johan Ugander)和布萊恩·卡勒(Brian Karrer),他們拿到了Facebook的完整數(shù)據(jù),那時(shí)Facebook的注冊(cè)用戶僅有7.21億。通過研究朋友關(guān)系網(wǎng)絡(luò),他們發(fā)現(xiàn)有93%的用戶的朋友擁有的朋友數(shù)量比他們自己多。一個(gè)用戶平均的粉絲數(shù)是190個(gè),而他朋友擁有的粉絲數(shù)是他的3倍多,準(zhǔn)確地說,是635個(gè)。

《花生漫畫》(美國(guó)著名報(bào)紙連環(huán)漫畫,包含了查理·布朗、史努比等經(jīng)典角色。)里的伙伴們把桌子布置好來慶祝情人節(jié)派對(duì),孩子們手上都拿著情人節(jié)卡片(在美國(guó),不僅情人之間會(huì)相互交換情人節(jié)卡片,朋友之間也會(huì)相互交換)。派對(duì)結(jié)束之后,孩子們都帶著一疊交換來的情人節(jié)卡片回到了家里,只有查理一個(gè)人悶悶不樂,兩手空空地待著。

好吧,大家可能會(huì)說:查理從來都沒有受到重視,沒人發(fā)現(xiàn)每個(gè)人擁有的朋友都比查理要多。

可事實(shí)上,我們中的大部分人都是查理。我們確實(shí)有朋友,但是我們的朋友擁有的朋友比我們要多——這種像繞口令般又像悖論一般的言論是通過經(jīng)驗(yàn)得到驗(yàn)證的。

2011年5月,有兩位博士生—約翰·尤甘德(Johan Ugander)和布萊恩·卡勒(Brian Karrer),他們拿到了Facebook的完整數(shù)據(jù),那時(shí)Facebook的注冊(cè)用戶僅有7.21億。通過研究朋友關(guān)系網(wǎng)絡(luò),他們發(fā)現(xiàn)有93%的用戶的朋友擁有的朋友數(shù)量比他們自己多。一個(gè)用戶平均的粉絲數(shù)是190個(gè),而他朋友擁有的粉絲數(shù)是他的3倍多,準(zhǔn)確地說,是635個(gè)。

1000.webp.jpg

可能有人懷疑:這是不是個(gè)圈套???數(shù)據(jù)是假的吧?問題的答案一如既往地簡(jiǎn)單,不過我們可以先放一放。

我們來舉一個(gè)不同類型的例子吧。

為了讓自己保持完美的體型,我沉迷于舉重。我不敢保證我已經(jīng)鍛煉成了一個(gè)肌肉男,不過我的身材還是在平均水平上的。然而,我每次走進(jìn)健身房,都覺得健身房里到處都是健美運(yùn)動(dòng)員——這不是我最擔(dān)心的東西,我對(duì)這些很在行,但是第一眼看到的時(shí)候還是覺得有點(diǎn)困惑。

造成這種異常的原因可能是什么呢?一個(gè)健身愛好者,去健身房的次數(shù)肯定比普通人多,碰上健美運(yùn)動(dòng)員的概率也就更大,因此會(huì)造成經(jīng)??吹竭@么多身材健美的運(yùn)動(dòng)員的感覺,事實(shí)上這些人在健身房的比例并沒有想象的那么高。

第二個(gè)例子:假設(shè)你是一名老師,教授兩名課程,一門是入門課程,有90名學(xué)生;另一門是進(jìn)階課程,只有10名學(xué)生。從老師的角度看,毫無疑問,平均每個(gè)班有50名學(xué)生。

但從學(xué)生的角度看呢?對(duì)于學(xué)入門課程的那90名學(xué)生來說,他們班是由90名學(xué)生組成的;而對(duì)于另外10名學(xué)生來說,他們班是由10名學(xué)生組成的,因此學(xué)生的平均數(shù)應(yīng)該是(90×90+10×10)/(90+10),因此平均每個(gè)班有82名學(xué)生,又一次產(chǎn)生分歧了。

這個(gè)模式應(yīng)該更清晰:產(chǎn)生分歧的原因在于一個(gè)是從客觀角度(學(xué)生的數(shù)量)計(jì)算的平均數(shù),而另一個(gè)是從主觀角度(同班同學(xué)的數(shù)量)來計(jì)算的。

當(dāng)參考集存在差別的時(shí)候——不常去健身房的客人比較少待在那里,而健身房的常客常常出現(xiàn)在那里,兩個(gè)班中一個(gè)班的學(xué)生很多而另一個(gè)班很少,這時(shí)會(huì)使用集合中的所有元素作為參考來計(jì)算平均值,擁有更多聯(lián)系的元素在計(jì)算中占的比值會(huì)更大,從而影響整個(gè)平均水平。如下圖所示,我們先用少量數(shù)字來試一下。

圓圈里面表示的是人,把他們連接起來的線段表示他們相互之間的關(guān)系。我們把每個(gè)人擁有的朋友數(shù)進(jìn)行相加,就能得到2+3+3+2=10個(gè)朋友(每個(gè)關(guān)系都計(jì)算了兩次),平均到4個(gè)人身上,每個(gè)人有2.5個(gè)朋友。

現(xiàn)在我們來計(jì)算一下“朋友的朋友”的平均數(shù)。我們這樣來進(jìn)行定義:我們把每個(gè)人擁有的朋友都算進(jìn)去,然后找出這些朋友的朋友,算平均數(shù)。

約翰(J)有兩個(gè)朋友,即喬治(G)和林戈(R),他們倆分別有3個(gè)朋友;對(duì)于保羅(P)來說也是一樣的情況,那么他們之間的平均數(shù)就是(3+3)/2=3。喬治和林戈各有3個(gè)朋友,其中兩個(gè)(約翰和保羅)有兩個(gè)朋友,而另一個(gè)有3個(gè)朋友;他們之間的平均數(shù)是(2+2+3)/3=7/3。因此,總的平均數(shù)是(3×2+7/3×2)/4=8/3,這比我們最開始算出來的2.5要大。朋友關(guān)系網(wǎng)絡(luò)越分散,那么算出來的兩個(gè)平均值差距就越大。

如果我們?cè)谶@個(gè)朋友關(guān)系圖中再加一個(gè)人——埃莉諾,她只有林戈一個(gè)朋友(林戈的朋友可真多?。敲磁笥训目倲?shù)就是12,平均數(shù)就降為2.4了。而朋友的朋友的平均值則為3.13,比原先還要多!

Facebook的那個(gè)調(diào)查也是類似的原理。不過,注意啦!這個(gè)表面上看起來像悖論的理論只對(duì)Facebook有效,如果在Twitter網(wǎng)上做同樣的研究,會(huì)得到完全不一樣的結(jié)果。

事實(shí)上,關(guān)注一名用戶這個(gè)行為不是相對(duì)的,A可以關(guān)注B,但是B可能根本不知道A是誰。因此,在班級(jí)的例子中,班里所有的同學(xué)都和其他人對(duì)應(yīng)建立了同學(xué)的關(guān)系,那么這個(gè)例子里的乘數(shù)因子就不再適用了。總之,Twitter不是簡(jiǎn)化版的Facebook,至少它們之間存在背景差異。

原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于騰訊科技,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家