IBM在watsonx.ai平臺(tái)推出輕巧商用AI基礎(chǔ)模型Granite

來源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-09-12
2970
IBM準(zhǔn)備在其人工智能開發(fā)平臺(tái)watsonx.ai,上架稱為Granite的商用基礎(chǔ)模型,這些基礎(chǔ)模型主要用于處理語言以及程序代碼。

watsonxai.jpg

IBM準(zhǔn)備在其人工智能開發(fā)平臺(tái)watsonx.ai,上架稱為Granite的商用基礎(chǔ)模型,這些基礎(chǔ)模型主要用于處理語言以及程序代碼。Granite基礎(chǔ)模型由IBM研究院開發(fā),擁有130億個(gè)參數(shù),官方提到,Granite模型剛好能使用單一V100-32GB GPU執(zhí)行。

IBM使用多種數(shù)據(jù)集來訓(xùn)練Granite系列模型,總量為7 TB的原始數(shù)據(jù),經(jīng)過預(yù)處理后仍有2.4 TB,這些數(shù)據(jù)擁有1兆個(gè)Token,IBM根據(jù)商業(yè)使用需求,挑選涵蓋網(wǎng)絡(luò)、學(xué)術(shù)、程序代碼、法律和財(cái)務(wù)領(lǐng)域的數(shù)據(jù)集訓(xùn)練模型,因此Granite系列模型能夠熟悉這些領(lǐng)域的語言和術(shù)語,并根據(jù)相關(guān)產(chǎn)業(yè)知識(shí)提供決策。

Granite模型可以被廣泛地應(yīng)用在各種產(chǎn)業(yè),除了商業(yè)領(lǐng)域上的摘要、問答和分類之外,Granite模型也支持諸如內(nèi)容生成、分析、增強(qiáng)檢索生成(Retrieval Augmented Generation,RAG)與專有名詞識(shí)別(Named Entity Recognition,NER)等功能。

官方強(qiáng)調(diào),模型訓(xùn)練使用的數(shù)據(jù)集經(jīng)過治理、風(fēng)險(xiǎn)和法遵審查流程,因此用戶可以將Granite模型用于自家的應(yīng)用程序。而且Granite模型訓(xùn)練資訊集經(jīng)過IBM HAP偵測器處理,該偵測器能夠偵測并移除仇恨等內(nèi)容,減少Granite模型生成不適當(dāng)輸出的可能性。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說明:本文內(nèi)容來自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多