Meta研究人員創(chuàng)建人工智能系統(tǒng),來(lái)編寫(xiě)出維基百科風(fēng)格的傳記草稿,使得維基百科編輯能夠以最少的編輯,在維基百科上提供女性人物的傳記,以補(bǔ)充目前維基百科上,男女性人物傳記數(shù)量失衡的狀況。
維基百科一直是全球訪問(wèn)量前10名的網(wǎng)站,是許多人搜索歷史人物與領(lǐng)創(chuàng)者資訊的第一站,但這些人的傳記,并不總是被平等的呈現(xiàn)在維基百科上,根據(jù)維基媒體自己的研究資料,英文網(wǎng)站上只有大約20%的傳記是關(guān)于女性。Meta研究人員提到,交叉性群體像是科學(xué)界女性、非洲女性或是亞洲女性的傳記數(shù)量可能更少。
雖然女性可能更傾向于撰寫(xiě)其他女性的傳記,但Meta研究人員在維基媒體《2021年社群洞察報(bào)告》中發(fā)現(xiàn),維基百科中只有15%的編輯是女性,他們提到,女性在歷史上,對(duì)科學(xué)、政治、社會(huì)甚至是企業(yè)家精神,都產(chǎn)生巨大的影響,但是這些女性人物卻被忽視,或是被以不成比例的方式在維基百科上呈現(xiàn)。
研究人員舉例,像是加拿大物理學(xué)家Donna Strickland,在2018年的時(shí)候獲得諾貝爾物理學(xué)獎(jiǎng),卻在維基百科上無(wú)法找到任何關(guān)于他的資訊,一直到Donna Strickland獲得該領(lǐng)域最大的獎(jiǎng)項(xiàng),他的傳記才終于被發(fā)布。
因此Meta研究人員,開(kāi)發(fā)了一個(gè)端到端人工智能模型,作為解決問(wèn)題的起點(diǎn),該模型能夠自動(dòng)創(chuàng)建現(xiàn)實(shí)公眾人物的傳記文章。模型會(huì)先在網(wǎng)絡(luò)上搜索相關(guān)的資訊,并且寫(xiě)出關(guān)于該人物的維基百科式條目,并且附上引用資料。
由于該人工智能系統(tǒng)仍還存在一些限制,因此定位上需要能與維基百科編輯互補(bǔ),由人工智能系統(tǒng)產(chǎn)生草稿,接著再由編輯進(jìn)行事實(shí)查證和補(bǔ)充。模型的限制包括,用來(lái)創(chuàng)建維基百科條目的網(wǎng)頁(yè)內(nèi)容,可能存在文化偏見(jiàn),而且在技術(shù)上,文本生成系統(tǒng)容易產(chǎn)生幻覺(jué)(Hallucination),也就是非事實(shí)的內(nèi)容。
以下彩色文本,是由模型替無(wú)脊椎動(dòng)物的研究先驅(qū)Libbie Hyman,所生成的簡(jiǎn)短傳記,綠色文本來(lái)自參照文章,紫色文本則來(lái)自網(wǎng)絡(luò)上的證據(jù),橘色文本則表示幻覺(jué),是由模型腦補(bǔ),無(wú)法被驗(yàn)證的資訊。
雖然模型所生成的結(jié)果無(wú)法直接被使用,但是模型檢索了Libbie Hyman相關(guān)資料,包括對(duì)無(wú)脊椎動(dòng)物的研究、重要出版物和工作等,使得維基百科編輯能根據(jù)這項(xiàng)基礎(chǔ),借由驗(yàn)證內(nèi)容的正確性,并且補(bǔ)充Libbie Hyman的生活和成就,更快速地完成傳記。
雖然在技術(shù)上還是有不足的地方,但這卻是對(duì)維基百科內(nèi)容的性別平等踏出重要的一步,這項(xiàng)研究接下來(lái)還有許多工作要做,研究人員提到,他們目前的工作,僅是解決一個(gè)復(fù)雜問(wèn)題的一小部分,其他問(wèn)題像是在參照網(wǎng)絡(luò)資料時(shí),女性的傳記通常包含更多額外的生活細(xì)節(jié),像是離婚這個(gè)詞,出現(xiàn)在女性傳記的頻率是男性傳記的4倍,來(lái)自小報(bào)的素材,往往更關(guān)注女性的生活,而這些細(xì)節(jié)可能沖淡更應(yīng)該專(zhuān)注的成就。
Meta研究人員提到,目前該模型把重點(diǎn)擺在女性,不過(guò)維基百科上還有許多內(nèi)容存在偏見(jiàn),根據(jù)維基百科對(duì)社群文章偏見(jiàn)的研究,發(fā)現(xiàn)跨性別和二元性別人物的傳記,往往長(zhǎng)度更長(zhǎng),但是大部分章節(jié)都是描寫(xiě)個(gè)人生活,而非個(gè)人成就,因此要在當(dāng)前的內(nèi)容中,識(shí)別不同的偏見(jiàn)形式,也是接下來(lái)需要繼續(xù)研究的部分。