IBM準(zhǔn)備在其人工智能開發(fā)平臺(tái)watsonx.ai,上架稱為Granite的商用基礎(chǔ)模型,這些基礎(chǔ)模型主要用于處理語言以及程序代碼。Granite基礎(chǔ)模型由IBM研究院開發(fā),擁有130億個(gè)參數(shù),官方提到,Granite模型剛好能使用單一V100-32GB GPU執(zhí)行。
IBM使用多種數(shù)據(jù)集來訓(xùn)練Granite系列模型,總量為7 TB的原始數(shù)據(jù),經(jīng)過預(yù)處理后仍有2.4 TB,這些數(shù)據(jù)擁有1兆個(gè)Token,IBM根據(jù)商業(yè)使用需求,挑選涵蓋網(wǎng)絡(luò)、學(xué)術(shù)、程序代碼、法律和財(cái)務(wù)領(lǐng)域的數(shù)據(jù)集訓(xùn)練模型,因此Granite系列模型能夠熟悉這些領(lǐng)域的語言和術(shù)語,并根據(jù)相關(guān)產(chǎn)業(yè)知識(shí)提供決策。
Granite模型可以被廣泛地應(yīng)用在各種產(chǎn)業(yè),除了商業(yè)領(lǐng)域上的摘要、問答和分類之外,Granite模型也支持諸如內(nèi)容生成、分析、增強(qiáng)檢索生成(Retrieval Augmented Generation,RAG)與專有名詞識(shí)別(Named Entity Recognition,NER)等功能。
官方強(qiáng)調(diào),模型訓(xùn)練使用的數(shù)據(jù)集經(jīng)過治理、風(fēng)險(xiǎn)和法遵審查流程,因此用戶可以將Granite模型用于自家的應(yīng)用程序。而且Granite模型訓(xùn)練資訊集經(jīng)過IBM HAP偵測器處理,該偵測器能夠偵測并移除仇恨等內(nèi)容,減少Granite模型生成不適當(dāng)輸出的可能性。