Google云計(jì)算數(shù)據(jù)倉(cāng)庫(kù)服務(wù)BigQuery加入文本嵌入(Text Embedding)生成功能,開發(fā)者將可以通過(guò)熟悉的SQL指令截取文本嵌入,并將其應(yīng)用到下游應(yīng)用程序中。目前BigQuery所支持的文本嵌入,可由textembedding-gecko、BERT、NNLM以及SWIVEL模型所生成。
這項(xiàng)新功能的使用流程,由注冊(cè)需要的模型成為遠(yuǎn)程模型開始,接著用戶就可以使用生成文本嵌入函數(shù)來(lái)生成嵌入,而這些操作都僅使用BigQuery SQL就可以完成。文本嵌入是一個(gè)由文本轉(zhuǎn)化而來(lái)的矢量,可用來(lái)尋找相似的項(xiàng)目,像是語(yǔ)義搜索、分類、分群、異常偵測(cè)和或是對(duì)話式接口等應(yīng)用。
BigQuery新支持的4種模型嵌入,其中textembedding-gecko是運(yùn)用Google語(yǔ)言模型PaLM生成嵌入,其他三個(gè)模型BERT、NNLM以及SWIVEL,則都可以從TensorFlow Hub選用。BERT是Transformer架構(gòu)的深度預(yù)訓(xùn)練網(wǎng)絡(luò),可針對(duì)自然語(yǔ)言生成密集的矢量表示,NNLM與SWIVEL則是以英文Google新聞?wù)Z料庫(kù)訓(xùn)練而成。
同時(shí),官方也宣布開始支持array。