云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)BigQuery現(xiàn)可生成文本嵌入強(qiáng)化自然語(yǔ)言應(yīng)用

來(lái)源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2023-08-30
2890
Google云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)BigQuery加入文本嵌入(Text Embedding)生成功能,開發(fā)者將可以通過(guò)熟悉的SQL指令截取文本嵌入,并將其應(yīng)用到下游應(yīng)用程序中。目前BigQuery所支持的文本嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

introducing_bigquery_text_embeddings.jpg

Google云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)BigQuery加入文本嵌入(Text Embedding)生成功能,開發(fā)者將可以通過(guò)熟悉的SQL指令截取文本嵌入,并將其應(yīng)用到下游應(yīng)用程序中。目前BigQuery所支持的文本嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。

這項(xiàng)新功能的使用流程,由注冊(cè)需要的模型成為遠(yuǎn)程模型開始,接著用戶就可以使用生成文本嵌入函數(shù)來(lái)生成嵌入,而這些操作都僅使用BigQuery SQL就可以完成。文本嵌入是一個(gè)由文本轉(zhuǎn)化而來(lái)的矢量,可用來(lái)尋找相似的項(xiàng)目,像是語(yǔ)義搜索、分類、分群、異常偵測(cè)和或是對(duì)話式接口等應(yīng)用。

BigQuery新支持的4種模型嵌入,其中textembedding-gecko是運(yùn)用Google語(yǔ)言模型PaLM生成嵌入,其他三個(gè)模型BERT、NNLM以及SWIVEL,則都可以從TensorFlow Hub選用。BERT是Transformer架構(gòu)的深度預(yù)訓(xùn)練網(wǎng)絡(luò),可針對(duì)自然語(yǔ)言生成密集的矢量表示,NNLM與SWIVEL則是以英文Google新聞?wù)Z料庫(kù)訓(xùn)練而成。

同時(shí),官方也宣布開始支持array。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家