Facebook母公司Meta今天宣布了一個(gè)名為Sphere的新工具,該工具圍繞著挖掘開放網(wǎng)絡(luò)上的巨大信息庫(kù),為人工智能和其他系統(tǒng)的工作提供知識(shí)基礎(chǔ)而建立。
Sphere的第一個(gè)用戶是維基百科,它正在用它自動(dòng)掃描詞條,并識(shí)別其詞條中的引文何時(shí)得到有力支持或沒(méi)有支持。該研究團(tuán)隊(duì)已經(jīng)開放了Sphere的源代碼,它目前基于1.34億個(gè)公共網(wǎng)頁(yè)。
將Sphere用于維基百科的想法很簡(jiǎn)單:該在線百科全書有650萬(wàn)個(gè)條目,平均每月增加約17000篇文章。這背后的維基概念實(shí)際上意味著添加和編輯內(nèi)容是眾包的,雖然有一個(gè)編輯團(tuán)隊(duì)負(fù)責(zé)監(jiān)督,但這是一項(xiàng)艱巨的任務(wù),而且與日俱增,不僅僅是因?yàn)槠湟?guī)模,還因?yàn)槠淙蝿?wù)。
與此同時(shí),監(jiān)管維基百科的維基媒體基金會(huì)一直在權(quán)衡利用所有這些數(shù)據(jù)的新方法。上個(gè)月,它宣布了一個(gè)企業(yè)層級(jí)和它的第一批兩個(gè)商業(yè)客戶Google和互聯(lián)網(wǎng)檔案館,它們使用基于維基百科的數(shù)據(jù)為自己的商業(yè)利益服務(wù),現(xiàn)在將有更廣泛和更正式的服務(wù)協(xié)議圍繞它。
就Meta公司而言,該公司繼續(xù)被公眾的不良看法所拖累,部分原因是有人指責(zé)它使錯(cuò)誤信息和有毒思想得以自由傳播,所以推出Sphere這樣的東西感覺(jué)有點(diǎn)像Meta公司的公關(guān)活動(dòng),如果它能發(fā)揮作用,也可能是一個(gè)有用的工具,就表明該組織中有人在努力真誠(chéng)地工作。
今天關(guān)于Meta與維基百科合作的公告并沒(méi)有提到維基媒體企業(yè),但一般來(lái)說(shuō),為維基百科增加更多的工具,以確保其擁有的內(nèi)容是經(jīng)過(guò)驗(yàn)證和準(zhǔn)確的,這將是企業(yè)服務(wù)潛在客戶在考慮為該服務(wù)付費(fèi)時(shí)想知道的事情。
目前還不清楚這項(xiàng)交易是使維基百科成為Meta的付費(fèi)客戶。不過(guò),Meta確實(shí)指出,為了訓(xùn)練Sphere模型,它創(chuàng)建了一個(gè)新的數(shù)據(jù)集(WAFER),包括400萬(wàn)條維基百科引文,比以往用于此類研究的數(shù)據(jù)集要復(fù)雜得多。而就在五天前,Meta宣布維基百科的編輯們也在使用它建立的一個(gè)新的基于人工智能的語(yǔ)言翻譯工具,所以顯然這里面有聯(lián)系在其中。