上周,阿里云在武漢AI峰會(huì)上宣布阿里云通義千問(wèn)大模型通義9款主力大模型大幅降價(jià)。其中,通義千問(wèn)GPT-4級(jí)主力模型Qwen-Long的API輸入價(jià)格低至1塊錢(qián)可以買(mǎi)200萬(wàn)tokens。
距離大降價(jià)不到一周,企業(yè)和開(kāi)發(fā)者用自己的積極響應(yīng)表示了對(duì)通義大模型的支持。近日在阿里云青島AI峰會(huì)上,阿里云智能集團(tuán)副總裁、公共云華北大區(qū)總經(jīng)理高飛表示已有頭部企業(yè)調(diào)用量翻了100倍,并列舉了通義大模型降價(jià)后的一周的三大變化。
公共云+API,直接調(diào)用大模型更便捷
一家制造業(yè)龍頭企業(yè),降價(jià)前基于開(kāi)源模型做私有化部署,降價(jià)后CTO決定調(diào)整公司策略,以公共云+API調(diào)用通義的形式為主,進(jìn)一步提效降本。
不管是開(kāi)源模型還是商業(yè)化模型,公共云+API都將成為企業(yè)使用大模型的主流方式。最近的一份調(diào)查顯示,70%的組織正在使用這種方式。
為了更好的支持生成式人工智能的創(chuàng)新,阿里云已經(jīng)建立了“以模型為中心”的完整技術(shù)棧,進(jìn)一步發(fā)揮公共云的成本和性能優(yōu)勢(shì)。自研的異構(gòu)芯片互聯(lián)、高性能網(wǎng)絡(luò)HPN7.0、高性能存儲(chǔ)CPFS、人工智能平臺(tái)PAI等核心技術(shù)和產(chǎn)品,構(gòu)建了極致彈性的AI算力調(diào)度系統(tǒng)。同時(shí),百煉分布式推理加速引擎,也壓縮了模型推理成本,并加快模型推理速度。
投入產(chǎn)出比更好,大規(guī)模應(yīng)用更輕松
降價(jià)后,一家頭部招聘企業(yè)將大模型從簡(jiǎn)歷篩查推廣到更多創(chuàng)新業(yè)務(wù)場(chǎng)景。以往,人工和智能的成本難分高下,降價(jià)后高下立判。一周內(nèi),該企業(yè)的大模型調(diào)用量翻了100倍,但數(shù)百萬(wàn)調(diào)用量的成本不到200元,成本大幅下降。
即便是同樣的開(kāi)源模型,在公共云上的調(diào)用價(jià)格也遠(yuǎn)遠(yuǎn)低于私有化部署。以使用Qwen-72B開(kāi)源模型、每月1億tokens用量為例,在阿里云百煉上直接調(diào)用API每月僅需600元,私有化部署的成本平均每月超1萬(wàn)元。
未來(lái),相較于模型的私有化部署,公共云上調(diào)用的成本優(yōu)勢(shì)會(huì)持續(xù)擴(kuò)大,這是由公共云的規(guī)?;瘍?yōu)勢(shì)決定的。
調(diào)用接近“免費(fèi)”,“先跑起來(lái)”更容易
用大模型做業(yè)務(wù)創(chuàng)新,對(duì)中小企業(yè)和開(kāi)發(fā)者來(lái)說(shuō),是非常友好的方式。沒(méi)有很高的技術(shù)門(mén)檻,也沒(méi)有很重的技術(shù)投入,接近“免費(fèi)”的使用成本,打消了他們最后的顧慮——不用考慮先算錢(qián),還是先做應(yīng)用。
同時(shí),阿里云百煉平臺(tái)還內(nèi)置了大模型定制與應(yīng)用開(kāi)發(fā)工具鏈,開(kāi)發(fā)者可以便捷地測(cè)試比較不同模型,開(kāi)發(fā)專(zhuān)屬大模型,并輕松搭建RAG等應(yīng)用。從調(diào)模型、搭應(yīng)用到對(duì)外服務(wù),一站式搞定。