2024 年底,Cursor 以 26 億美元估值完成了 1 億美元融資,四個月內(nèi)估值漲了 6.5 倍。更早之前,另一家主打「AI 程序員」的創(chuàng)業(yè)公司 Devin 在還沒有產(chǎn)品推出、只有宣傳片的情況下,就以 20 億美金的估值籌集了 1.75 億美元。
這樣的例子還有很多。過去一年,代碼領域的 AI 應用層出不窮,你肯定見過這些名字,Github Copilot、Claude3.5 Artifacts、Bolt.new、Windsurf、Replit、Vercel……
AI Coding,為什么成了最火的 AI 應用賽道?
2024 年底,多位獨立開發(fā)者向極客公園表示,從大廠辭職、成為自己的老板的自由是 Cursor 給的,現(xiàn)在 Cursor 最多可以幫助完成 50% 的代碼。同時,隨著大模型從預訓練的 Scaling Law 切換到推理側(cè)后,AI 寫代碼的能力還在明顯提升。
種種現(xiàn)象都在表明,在沒有迎來 AI 應用大爆發(fā)、仍在拿著錘子找釘子的 2024 年,「AI 幫助人類寫代碼」是為數(shù)不多已經(jīng)看到 PMF(產(chǎn)品市場匹配)的場景,甚至是最有可能實現(xiàn) AGI、完全自動化的賽道。
更重要的是,當 AI 讓產(chǎn)出物可以跳過代碼、直接變成軟件時,市場空間迎來了十倍、百倍的釋放。
2024 年 12 月 27 日,極客公園「今夜科技談」直播間邀請極客公園創(chuàng)始人 & 總裁張鵬,和 AIGCode 創(chuàng)始人 & CEO 宿文、豆包 MarsCode 產(chǎn)品負責人石揚,一起聊了聊當下最熱鬧的 AI Coding 賽道,以及中國創(chuàng)業(yè)者的機會。
01、4 個月估值翻了 6.5 倍背后,Cursor 的 PMF 超出預期
張鵬:最近 Cursor 以 26 億美元的估值融資 1 億美元,4 個月估值翻了 6.5 倍。除此以外,今年海外 AI Coding 賽道里也還有很多創(chuàng)業(yè)公司都以迅速膨脹的估值拿到了一輪又一輪融資。為什么現(xiàn)在這個賽道非常熱?
石揚:現(xiàn)在整個大模型賽道特別像互聯(lián)網(wǎng)非常早期的狀態(tài)——大家在持續(xù)地尋找 PMF,無論是從 AI 原生應用的角度,還是在一個既有的 APP 里把 AI 能力加進去,其實大家都是在用各種各樣的方式嘗試。
但代碼很顯然是一個被證明有非常大潛力,且一定程度上已經(jīng)實現(xiàn) PMF(產(chǎn)品市場匹配)的場景。
最近 Cursor 比較火的一個主要原因是基礎模型有了很大的突破,比如Claude 3.5 Sonnet 出現(xiàn)之后,讓 Cursor 過去做的一些事情被放大了。當然,只有模型能力也不夠,Cursor 并不是短期突然冒出來的,而是在這個行業(yè)里持續(xù)做了很多,它的成功是一個厚積薄發(fā)的過程。
張鵬:如果我們拆解一下 Cursor 的成功,哪些是模型比如 Claude3.5 出現(xiàn)之后,大模型帶來的助推?哪些可能是 Cursor 自己的積累?
石揚:我覺得 AI Coding 這個市場已經(jīng)經(jīng)歷了兩次 PMF。
第一次 PMF 大概在一年前,應用形態(tài)是 Copilot。那個時候 Copilot 主要的功能發(fā)生在代碼補全,比如我寫一個 function(函數(shù))時,AI 可以直接補全出來更好的代碼。因為它的能力基于 ChatGPT 大模型,而大模型的底層邏輯 Transformer 算法是預測下一個 token,由于更結(jié)構化、代碼的預測難度相比語言更簡單一些,所以很快找到了 PMF。
Claude3.5 的出現(xiàn)讓我們看到另一個點——通過 Chat(聊天對話)的形式與 AI 對話,可以理解你的需求,直接生成更好的(代碼),這是第二次 PMF,從單純的代碼補全、跨文件的補全,到 Chat 這個層面的變化。
但是只有基礎模型也不行,在嚴肅的軟件開發(fā)的場景里,能力只是底層,工具是對于很多能力的一層封裝,比如 Claude 3.5 也有 Artifacts 這種產(chǎn)品的類型。
所以這里有三層事情:第一層是模型,第二層是工程,第三層是產(chǎn)品,Cursor 很好地結(jié)合了這三個部分。
當然也有很多討論,大家會問 Cursor 的護城河到底是什么?它是否只做了膠水層的東西?Cursor 其實看到了很多用戶的真實需求,這是在 AI 這個時代做產(chǎn)品最難的地方——如何真正地滿足用戶需求。因為我們幻想了太多 AI 的能力,AI 可以成為這個、可以成為那個、可以實現(xiàn) AGI,但實際上真的能夠回到用戶場景里,很好地把 AI 的能力 fit in 到用戶需求里,Cursor 做了很多。比如它做了很多小模型和亮點功能,像「Fast Apply」能夠迅速把生成的代碼準確地插入到你特定的文件里,「在正確的時間、正確的位置生成正確的代碼」。
宿文:我們之前有一次很有意思的討論說,Cursor 想做在大廠或者 AGI 巨頭的車輪前面「搶錢」的一個創(chuàng)業(yè)公司,并不是說這樣的創(chuàng)業(yè)模式不好,其實反而是很精準,很多創(chuàng)業(yè)公司就應該做這樣的事情。
在整個代碼賽道上,不管從哪個點切入,抓住了用戶的痛點、把需求解決掉收到錢,這是像 Cursor 給市場帶來的很正向的反饋——你會看到它真正的、實打?qū)嵉?ARR(年度經(jīng)常性收入)的增長。Cursor 應該是用 9 個月的時間做到了 7000 萬美金的 ARR,還在繼續(xù)上漲。另外像 Bolt.new 用 3 個月的時間做到 1200 萬美金的 ARR,也是很興奮的進展。
張鵬:最近一年陸續(xù)聽到很多開發(fā)者說像 Cursor 這樣的工具已經(jīng)能夠幫助他寫一半的代碼了。從你們的視角,今天程序員的工作習慣正在發(fā)生哪些變化?我們來更具象地看看目前代碼類AI產(chǎn)品、技術處于什么樣的階段?
石揚:你不用它可能覺得也就那么回事,但你一旦用完了之后就會發(fā)現(xiàn)很難再離開它。比如在你敲代碼時,Copilot 大概率會補齊你的那一段比如 function(函數(shù)),這對程序員來講是一個非常高效的感受。就像自動駕駛一樣,以前我們開油車,大家都覺得比如「自動泊車」也沒有什么意義,但是你現(xiàn)在開電車用過哪怕一次自動停車后,發(fā)現(xiàn)再回到油車感覺怪怪的,就希望有這個功能。
再舉一個 Chat 類代碼應用的例子,我以前是一個開發(fā)者,你讓我去做一個「貪吃蛇」小游戲,且把它做得有一定的可用性,也要花 1 到 2 天的時間,包括前端、后端調(diào)優(yōu),持續(xù)做很多 debug(排故障)的邏輯。但是現(xiàn)在,基本上只要靠對話,不管是用我們自己的 MarsCode,還是 Cursor、Windsurf 這樣的產(chǎn)品,基本上兩三個小時就能調(diào)出一個過去要兩三天才能實現(xiàn)的事。
張鵬:海外這個賽道現(xiàn)在比較熱,這會給你們帶來哪些影響?
石揚:如果按照過去的方式來理解軟件,只把軟件當作一個工具,它依然是一個垂直賽道,即便 VS Code 或者 JetBrains 可能就十幾億美金,或者二十幾億美金的樣子。但 AI 的加成,讓這件事情從工具向軟件生產(chǎn)整個行業(yè)擴散,軟件賽道變得非常大,機會是非常多的。MarsCode 非常希望成為參與者,幫助開發(fā)者有機會生產(chǎn)更多的軟件。
我覺得整個從業(yè)者,大家既興奮,但也是焦急的。我們看到了一個很好的曙光、很好的 PMF,有很多用戶的需求存在在這里。
宿文:整個代碼賽道,也有幾類產(chǎn)品。剛才石揚提到的 Copilot,或者像 Cursor、Windsurf 這樣的一些產(chǎn)品,整體上還是給專業(yè)程序員使用,服務全球已經(jīng)存在的七八千萬程序員,大家已經(jīng)都在 IDE(集成開發(fā)環(huán)境)里工作,每天寫代碼,現(xiàn)在通過對話的方式能夠生成一些質(zhì)量更高的、片段式的代碼,這部分需求目前解決得不錯。
另外一類代碼類產(chǎn)品,是把代碼消費的能力大規(guī)模地釋放出來,超過全球七八千萬、占人口 1% 的程序員的范疇,讓全球 10%、20% 甚至更多的人有使用代碼的能力,當然這里用戶要的不是代碼,而是應用和軟件,這是我們 AIGCode 在做的事情,但是目前行業(yè)還沒有看到整個大規(guī)模的 PMF。
張鵬:宿文,對于你要實現(xiàn)的目標,AIGCode 目前處在什么階段?下一步要核心印證的東西是什么?是技術的可行性、還是對于需求的聚焦,最終把能力跟需求做到閉環(huán)?
宿文:國內(nèi)大模型這個賽道經(jīng)常會給人一種感覺是,「技術信仰主義」和「馬上要做商業(yè)化」這兩件事情是對立的,但是對于任何一個成功的公司而言,二者缺一不可。我們要思考,現(xiàn)在整個技術的邊界在哪,包括大模型的邊界和軟件工程的邊界,我們要如何做創(chuàng)新、來把技術的這兩個支柱融合在一起,最終通過產(chǎn)品,真正解決用戶的問題。
當然,因為用戶不同、場景不同,往往也決定了技術路線的不同,而不是有什么樣的技術路線就一定要怎么樣。我們是先定好對「直接生成軟件」的終局后,切入了最核心的點。一方面是自己做大模型,從而讓它的幻覺減少、以及像理科生一樣思維能力全面提升;另一方面是考慮到生成時代的軟件架構跟傳統(tǒng)的軟件業(yè)務架構會不一樣,所以從模型和軟件工程的角度來做產(chǎn)品。
未來幾周,我們的產(chǎn)品也會大規(guī)模釋放出來讓大家體驗和使用。
張鵬:對于 AIGCode 的目標而言,模型自研要解決什么樣的問題?
宿文:大模型時代真正能給各個行業(yè)帶來劃時代影響力的,還是大模型這個發(fā)動機。
在模型上,我們發(fā)現(xiàn)代碼生成的一些問題沒解決。對代碼來說,最主要的還是準確率,對還是錯、能不能 run(運行)起來,但大模型的一大痛點是幻覺。在這一點上,網(wǎng)絡結(jié)構上的優(yōu)化能夠帶來很多收益,包括從最近 DeepSeek-V3 的發(fā)布也能看到。同時,我們也會為了匹配更好、更絲滑的產(chǎn)品,在預訓練的過程加一些特殊的樣本、一些稀疏的樣本。
另外是長上下文,Cursor 也遇到了這樣的痛點,程序員在用的過程中,一開始很爽,基本寫到 2 個小時左右的時間點,就發(fā)現(xiàn) Cursor 的效率明顯不如人。在這一點上,Cursor 最近也收購了專門做上下文的公司 Supermaven,來解決上下文和模型自身記憶容量(有限)的問題。
張鵬:做 AI Coding 產(chǎn)品需要做預訓練模型,在整個行業(yè)里是一個相對共識嗎?
宿文:做預訓練模型不存在做一個垂直的模型:預訓練呈現(xiàn)出來的一定是 AGI 的能力;而做一個垂直的模型,基本全部的(通用)能力會喪失,這已經(jīng)是很多實驗驗證的(結(jié)論)了。
而且做模型的廠商在預訓練環(huán)節(jié)最關鍵的一部分就是加 Coding 數(shù)據(jù)。當加入一些其他語料比如中文、英文甚至化學、生物的時候,模型的能力會出現(xiàn)丟失,唯獨增加代碼能力后,所有專家的能力都會提升。我會感知到,代碼本身是一個很高質(zhì)量的語言,能夠激發(fā)出 AGI 的能力。
其實在編程賽道上,有兩家公司 Poolside 和 Magic 都自己做模型,因為他們發(fā)現(xiàn)很多模型用在寫代碼上還不夠聰明,這兩家公司的估值大概是 30 億美金左右。
我們比較認同 Poolside 的路徑,它體現(xiàn)出:大模型不管怎么做,生成的內(nèi)容最終還是會呈現(xiàn)在一個二進制軟件的世界里,做「代碼的生成」跟「做模型」這兩個事,一定程度上是等價的。在我看來,大家要把代碼端到端寫完,跟做 AGI 是一樣的。只是具體解決什么問題,提供什么產(chǎn)品不同。
02、AI Coding,大家到底在卷什么?
張鵬:我們借用一個框架來給現(xiàn)在比較熱門的AI代碼類創(chuàng)業(yè)公司定個位。Cursor、Github Copilot、Claude3.5 Artifacts、Devin、Bolt.new、Windsurf、Replit、Vercel,包括你們的產(chǎn)品 AutoCoder 和 MarsCode,分別在哪個象限?各自在解決什么問題?
為了幫助快速理解,該圖通過「解決某個人群(普通大眾/程序員)的什么問題(輔助編程/自主編程)」來定位產(chǎn)品。每個產(chǎn)品的切入點和路線不同,有的從專業(yè)用戶出發(fā)解決專業(yè)程序員自動化問題,最后直接輸出產(chǎn)品,有一部分是幫助普通人直接輸出產(chǎn)品,但終極目標都是實現(xiàn)代碼領域的 AGI,從 Copilot 往 Autopilot 不斷進化。
須注意:該象限圖只代表階段性觀察,各家產(chǎn)品/技術更新很快,不排除未來出現(xiàn)象限漂移;此外,該圖中的四個象限并不完全互斥,有的產(chǎn)品會同時涵蓋一二三象限。|制圖:極客公園
石揚:我更傾向把橫軸定義成「任務的復雜程度」,橫軸左邊是復雜任務、右邊是簡單任務。比如普通人想做一款「貪吃蛇」游戲;但是程序員可能要實現(xiàn)一個像抖音這么復雜的應用。
從這個角度看,Replit 最早只是一個 IDE,甚至不是 Copilot,但它和 VS Code 最近都加上了 agent 的邏輯,它大概也和 Bolt.new 在同一個象限,滿足簡單任務里的端到端實現(xiàn),與此同時也允許開發(fā)者(在復雜任務下)使用這個產(chǎn)品。
對于我們的產(chǎn)品 MarsCode 來講,目前還處在二三象限之間偏左一點的地方,希望服務程序員去完成復雜任務,讓 AI 幫助程序員提效,更好、更快地實現(xiàn)他想做的東西。MarsCode 未來的愿景是在二象限的左上,也就是能做到復雜任務的 Autopilot。同時,我們自己的產(chǎn)品其實也面向了許多簡單場景,因為即使是程序員、每天做非常復雜的應用時,依然也會做簡單場景的應用。所以 MarsCode 還是希望在更多場景里覆蓋不同人在不同場景里的需求。
宿文:我覺得無論是服務于程序員還是服務于普通人,大家整體都在縱軸的維度往上做,也就是從 Copilot 到越來越 Autopilot 的過程。在橫軸上,不管是從目標用戶來區(qū)分、還是從任務復雜程度來區(qū)分,其實是大家選擇交付不一樣的市場價值,最終收斂到產(chǎn)品也不一樣。
AutoCoder 還是考慮怎么做 Autopilot,把一些工具性或者冗雜性的工作變得足夠簡單。
Bolt.new 能夠生成比較高質(zhì)量的前端代碼,程序員能夠直接拷貝、使用,我們叫編譯,也提供一些 Web 端或者 APP 的端到端生成,但它目前的部署有點問題,是一個假部署。
Windsurf 基本上可以等價于 Cursor,產(chǎn)品體驗上可能會不同。Vercel 目前的形態(tài)跟 Bolt 會很像。
張鵬:這些產(chǎn)品里,哪些帶給你們最多的啟發(fā),你最喜歡哪個?
石揚:我個人比較喜歡兩個產(chǎn)品:第一個是 Cursor,第二個是 Bolt,我覺得它代表了目前產(chǎn)品的兩個流派。
為什么?Cursor 自己講它是「the first AI IDE」,本質(zhì)上它是基于 IDE 向 AGI 或者說 Autopilot 進發(fā)的,它面向的是專業(yè)的開發(fā)者。(但)這個群體其實已經(jīng)存在在 VS Code(微軟開發(fā)的一款跨平臺源代碼編輯器)很長時間了,VS Code 有非常豐富的工具鏈,所以 Cursor 要基于已經(jīng)存在的用戶場景做增量、試圖在這個場景里通過加入更多的 AI,讓用戶從微軟的 VS Code 向 Cursor 提供的 Autopilot 遷移。
Cursor 不僅是加了很多 AI 的能力,而且花了大量功夫讓程序員的編程體驗變好,比如說它的「Fast Apply」,它的「多點編輯」,包括它的「Tab」等等,乍一看覺得沒什么,但實際上就是這些細節(jié)讓它收獲了程序員的喜歡和共鳴,所以Cursor 是從 IDE 向 Auto pilot 進發(fā)的流派。
另一個是 Bolt.new,我覺得 Bolt 是從大模型向 Autopilot 去進發(fā),也就是說 Bolt 構建產(chǎn)品的邏輯是,我有了一個模型,模型能夠生成很多代碼,雖然它今天不完美。在這種情況下,Bolt 找到了一個場景——前端代碼的生成的能力。Bolt 這個產(chǎn)品給你的感受是不在意「編輯」,像 Cursor 基于 VS Code 向 Autopilot 演進的過程中是重編輯的,程序員寫代碼就跟你寫字一樣其實有一個非常大的編輯區(qū),但是 Bolt 重的是聊天,更重視「你告訴我你需要什么」,然后它幫你 generate(生成)。
未來我們會從關注代碼本身變成更加關注軟件,產(chǎn)出物直接變成了軟件,Bolt 讓我看到了未來可以實現(xiàn) Autopilot 的一種產(chǎn)品形態(tài),盡管它還非常早期。
張鵬:在代碼領域,Copilot 和 Agent(或者叫 Autopilot)這兩條線,這兩年經(jīng)歷了怎樣的發(fā)展?
宿文:Copilot 和 Autopilot 兩者的技術路徑、場景、商業(yè)化等等不太一樣,但整體上大家沿著南坡北坡爬(各自的)珠峰。
目前看起來,Copilot 在路徑發(fā)展上,整個 PMF 是超出預期的,今天對整個代碼領域、對程序員世界的改造已經(jīng)非常大了。
但是另外一邊,Autopilot——大家提出需求后能夠生成一個端到端(應用)。以前這樣的需求,是被一些低代碼工具在解決,但是限于低代碼本身的技術路線,沒有把這個事情給完成。
現(xiàn)在,通過大模型實現(xiàn)端到端生成時,能夠解決的問題是,完成一個 Web 端的端到端生成,像 Bolt.new 或者 Vercel v0.dev,或者還有一些偏 ToC 或者娛樂性的 Websim.ai、CreateAny.ai 都是,包括 Claude 的 Artifacts 主要也是圍繞 Web 前端去解決問題。但大家生成的質(zhì)量或者交付的最終形態(tài)上有比較大差別。
從整個 Autopilot 來看,我們團隊想象的是,一個完整的軟件應該從數(shù)據(jù)庫開始,從后端到前端是一套完整的軟件工程。目前還沒有看到一個類似的產(chǎn)品或者一個團隊做出這樣的事。Magic 和 Poolside AI 可能想做,比較期待他們最終會交付一個什么樣的產(chǎn)品出來。
03、ToC 基因的字節(jié),為什么要做代碼軟件
張鵬:剛才看了海外 AI Coding 領域創(chuàng)業(yè)公司的熱鬧和繁榮,國內(nèi)這個領域的進展怎么樣?
宿文:國內(nèi)起步倒不晚,基本上所有的大廠全部都進來開始做,創(chuàng)業(yè)公司也有,我們是差不多一年前做的,2024 年初。
在我們看來,做大模型和代碼生成,在本土競爭的空間是很小的,最終還是要面對全球化充分競爭,因為程序員都有能力去使用 Cursor、有能力去使用 Github Copilot,好產(chǎn)品大家是見過的。
過去一年看下來,國內(nèi)的產(chǎn)品還不那么彪悍,2025 年可能會有一些。
石揚:在移動互聯(lián)網(wǎng)時代,社交、電商、娛樂可能都會有地域性的產(chǎn)品,但開發(fā)者工具在過去是很少分地域的,一直是一個贏家通吃、強者恒強的市場,比如剛才提到的微軟的 VS Code。
現(xiàn)在很多人會說,其實沒有人能戰(zhàn)勝 VS Code。我也認為最大的大魔王一定是微軟,因為短期的競爭看產(chǎn)品和模型,長期的競爭是看成本和渠道。
但在產(chǎn)品上,大家都各有自己的看法,包括要不要做模型等等存在大量非共識。從我們的視角來看,短期來看,模型應該還是中國有中國的,海外有海外的。第二,上一代代碼產(chǎn)品是用作工具的,如果 AI 的加入仍舊讓這個東西是一個工具,我覺得不用卷了,VS Code 已經(jīng)足夠好,生態(tài)已經(jīng)足夠完善。但是今天 AI 的變量帶來的不只是工具。
張鵬:AI 在這里會帶來什么影響?
石揚:當 AI 在一定程度上幫助人直接做出不同類型的應用時,它帶來了新的機會。我反而認為在中國是一個非常獨特的市場,因為中國市場的需求足夠不同。海外的程序員做 Facebook、做 API-Driven 的 ToB 軟件;而中國程序員做抖音,做更加人工定制驅(qū)動的 ToB 業(yè)務。
所以無論是從底層預訓練模型給它的語料、數(shù)據(jù),還是在做工具、產(chǎn)品時的取舍上,都會不同。
舉個最簡單的例子,海外沒有小程序,你跟 Bolt 或者 Vercel 說:「你幫我生成一個小程序」,它都不知道小程序是什么東西,也就不知道怎么幫你做或者幫你調(diào)用;再比如在中國做 ToB 要大量的定制,這個時候你跟海外的產(chǎn)品說:「我要基于中國的某些軟件去做定制」,它也根本沒有這個經(jīng)驗。
所以從我們的視角看,第一,AI 時代的軟件生成,是有 Localization(本地化)需求的。第二,在全球,它是一個重新洗牌的機會。這也是為什么至少短期看,Cursor、Windsurf、Bolt,它們跑得這么好,當變量發(fā)生的時候,巨頭的反應永遠是相對慢的。但也要注意,當增長放緩的時候,你才能體會到巨頭的可怕。
宿文:代碼整個市場空間還是很大,大家用戶頻譜的切割不一樣,不管是大公司還是初創(chuàng)公司,只能切其中的一段去服務,還是要看到底切哪一段。
石揚:代碼生成,其實只是整個軟件鏈條里的一部分。生產(chǎn)一個軟件,至少要經(jīng)歷需求、設計、寫代碼、上線、維護全周期反復連續(xù)的迭代。
AI 這個新的生產(chǎn)力會讓過去不敢想,或者做不到的事情在一定程度上成為可能,全鏈條里面有太多太多的細分場景可以被提升,但現(xiàn)在看起來每一個方向是非常早期的狀態(tài)。
即便像 AI 寫代碼目前好像跑得稍微快一些,但我覺得都不一定能類比互聯(lián)網(wǎng)的 1998 年時刻,比如大家在投資雅虎的時候,很難想象后面還有這么多偉大的公司,F(xiàn)acebook、Google,包括阿里、騰訊、字節(jié)這些公司,所以很難精確地判斷它會是什么樣子,但我非常樂觀地期待,會有很多不一樣的事情誕生。
張鵬:評論區(qū)有人問,字節(jié)做這件事的 Vision 是什么?現(xiàn)在已經(jīng)有比較清晰的 Vision 了嗎,還是一種 Bottom-Up 的探索?
石揚:我覺得對于這件事情最大的 Vision,來自于我們看到 AI 釋放了新的生產(chǎn)力,能夠幫助到開發(fā)者去生成更多更好的軟件,能夠讓效率極大的提升?;氐絼偛拍菑垐D,我們希望到那張圖的左上角,因為簡單場景也會被復雜場景 Cover(包括進去)。
張鵬:今天我們在聊 AI Coding,SaaS 肯定是它衍生相關的領域,蝴蝶效應最快傳達的可能就是這個領域。評論區(qū)也有觀眾問,未來 SaaS 還存在嗎?大家會怎么看?
宿文:我覺得 SaaS 會長期存在。
從 SaaS 客戶的角度看,對 SaaS 軟件除了有合規(guī)、管理等相對標準化的工作流需求之外,還有各種個性化、長尾、非標,甚至是成長中的需求。這部分需求怎么滿足?過去,SaaS 軟件供給方其實趕不上需求方的成長速度,供給的成本、速度、質(zhì)量是相對滯后的。
現(xiàn)在,AI Coding 能把這部分需求空間擠掉,或者說 AI Coding 本身會滿足、釋放大量的個性化場景:非標、長尾的需求,甚至僅僅是一個人單次的使用需求,如果這個成本降到用一次手機流量的成本。從這個角度看,通用應用、SaaS 其實是支撐 AI Coding 滿足個性化需求的生態(tài)。我反而覺得這兩者會相互驅(qū)動、越來越繁榮。
張鵬:某種程度上,SaaS 的特性決定了,如果做大量的個性化需求,就沒法 SaaS(標準化軟件服務)了,但個性化的需求又是普遍存在,所以反而可能 AI Coding 彌補的頻譜是在 SaaS 的延展側(cè),有非常大的空間。你剛才講了一個極端的例子,「次拋型軟件」。
宿文:「用后即焚」。
張鵬:石揚怎么看 SaaS 領域未來的變化?
石揚:從我的視角,AI Coding 和 SaaS 并不是一個互斥、取代的關系。
張鵬:甚至是讓 SaaS 的降本增效更明顯,個性化交付變得更好。
石揚:對。我以前也是做 SaaS 出身的,我覺得 SaaS 也要分中美。我想問一句,SaaS 真的在中國存在過嗎?
如果 SaaS 的定義是企業(yè)軟件,那還有一類軟件叫做個人軟件或 ToC 軟件。我覺得 ToC 和 ToB 最大的差異在于:ToC 產(chǎn)品只要一兩個 Killer feature(殺手級功能),就可以滿足 80% 到 90% 的用戶需求。所以對于 ToC 應用,不存在長尾需求,無非是特別特別小的需求,其實也沒有太多人用;如果它的長尾足夠大,就會生產(chǎn)出另外一個應用來。
ToB 就不一樣了,它可能是 80% 的功能滿足了可能最多一半的用戶,剩下一半的用戶幾乎都是有個性化需求的。因為 ToC 講的是人性,人性都差不多;但是 ToB 講的是管理,管理是一個逆人性的事情,必然就會有非常非常多在這個公司里產(chǎn)生的合理的訴求,因為企業(yè)的管理方式、流程的不同。
在美國的生態(tài)環(huán)境下,滿足這些需求的方式來自于約定,「我知道這個功能不能完全滿足,但是我們可以約定:這個功能你可能再做一些努力,我也再做一些取舍,我們就用這樣一個標準化的應用完成工作流」。
在中國是另外一番場景,SaaS 是一個標準化軟件的方式,但是中國從來不 buy-in 標準化軟件,「我確實希望這個軟件長得更像我要的那個東西」。
所以 AI Coding 對于中國的 ToB 市場,反而是利好,不是 AI Coding 來了 SaaS 消失了,而是 AI 讓 SaaS 更能實現(xiàn)滿足中國用戶需求的企業(yè)軟件。其實在美國也是,不是個性化需求不存在,只是實現(xiàn)成本太高,所以妥協(xié)。
張鵬:個性化需求原先需要 SaaS 公司的定制化團隊提供額外服務,現(xiàn)在,用一個軟件就解決了個性化需求。原來 SaaS 是「Software as a Service,軟件即服務」,現(xiàn)在 AI 讓 SaaS 變成「Service as a Software,服務即軟件」。
04、AI Coding 的未來
張鵬:最近兩年大家被 AI 集中轟炸,短短兩年之內(nèi)很多人就失望過好幾輪了。比如大家還記得 Jasper 嗎?Jasper 當年出現(xiàn)時,一度讓人無比興奮,結(jié)果它的能力其實沒有逃離大模型的主射程。隨著模型比如 o1、o3 還在不斷往前走,模型通用能力以及代碼生成能力的繼續(xù)成長,AI Coding 應用未來會被大模型覆蓋嗎?
宿文:我們覺得,如果真正大家想象中的 AGI 的狀態(tài)能到來時,其實和代碼實現(xiàn)平權化基本上是同一個時間點。
但是今天來看,明顯沒到達。從技術上看,o1 也沒有把代碼生成的事情解決得很完美,o3 也還是在一個小樣本的空間內(nèi),在它見過的題目里面可以做得很好,但是怎么去做泛化的推理,以目前的技術路線可能還是很難實現(xiàn),或者實現(xiàn)成本巨高無比。
從初創(chuàng)公司的角度看,我們覺得還有其他路徑實現(xiàn)。目前整個 2024 年,其實在底層模型上的進展不多、亮點不多,DeepSeek V2 可能是一個(里程碑),DeepSeek V3 我們覺得還有比較大的完善空間。
從目前業(yè)內(nèi)的實踐來看,這中間的安全空間還蠻大,或者說 AI Coding 應用和大模型的進化這兩個東西是互相成就的,不用擔心進入大模型的射程,這還比較遙遠。
舉個最簡單的例子,o1 或者 o3 能夠在一些榜單上超過奧賽金牌,但是我們真正拿它代替一個最普通的軟件外包公司程序員解決更泛化的任務時,會發(fā)現(xiàn)好像也沒法替代。
石揚:我們是否焦慮被模型吞掉這件事情,從我個人的角度,我非常希望模型能夠吞掉。因為我更期待 AGI 發(fā)生,它可以幫我們做更多事情,實現(xiàn)了跨越式的發(fā)展。
第二,大模型和,AI Coding 或者 IDE 之間的關系,我覺得更像是大腦和工具的關系。大模型是大腦,它的智能會不斷地提升,但它依然需要工具幫它去體現(xiàn)它的智能。
比如可能 AI 在很多場景里已經(jīng)可以達到奧賽金牌的水平了,但是有幾個獲得奧賽金牌的人做程序員呢?不是超過了奧賽金牌水平你就是一個程序員、一個工程師,因為不同場景里對工程師有一些特有的要求。所以如何在特定場景里把智能釋放出來,這個是我們自己的使命,是要做的事情。
張鵬:同意,模型要是真的實現(xiàn) AGI,有無限供給的生產(chǎn)力了,人類都自由了,這是挺好的一件事。但科技從來不是一個大進度條的跳躍,都是一個像素點一個像素點的填充,比如今天的 Copilot。
今天要做好一個 AI Coding 的 Copilot,向 Autopilot 進化的過程中,技術成長的關鍵點會在哪里?
石揚:整個行業(yè)在預訓練上做的事情會越來越收斂,當然最領先的幾家一定會所謂的「獨家秘方」或者大招,但是共識會越來越趨同。
當把它收斂到一個 AI Coding 產(chǎn)品時,還有很多工作。
比如訓練模型,是要給它很多算法題比如 IMO 的這些題,讓它能夠很聰明地解出來。但是實際工作里,不是解算法題,而是要理解需求,比如生成一個小程序、一個前后端的應用,它到底需要什么樣的技術棧、框架、需要什么樣的 UI 前端渲染……所有這些東西。
牽引目標的不同,訓練方向也不同,你需要大量的比如 Post-training(后訓練)、RL(強化學習)、SFT(微調(diào)),才能夠真正讓模型加工具,更像一個程序員在工作。
張鵬:未來要解決無限供給的程序員,或者是無限提升的編程生產(chǎn)力,它在產(chǎn)業(yè)里最終可能會怎么實現(xiàn)?
宿文:今天還很早期。拉遠看,商業(yè)的形態(tài),或者說分發(fā)的形態(tài)會變成什么樣?我覺得要看在代碼生成里我們核心的三個指標的完成度。
一是效率,以前以小時、以周、以月為單位的程序員工作變成秒級,甚至毫秒級,那就完成了效率的使命。
第二,質(zhì)量,軟件工程是端到端運行的,哪怕有 bug(故障)也一樣能運行起來,但 AI 也能滿足質(zhì)量的需求,或者說讓更好的工具實現(xiàn)普惠。
最后是成本,當 AI 推理成本,變成電的成本,變成基礎設施的時候,就會有新的形態(tài)出來,比如會出現(xiàn)我們想象中的端到端的形態(tài)。不用下那么多 APP、但常用的就幾個了,個性化需求最后可能會收斂到一個應用,只有一個入口,這一個入口底下有大量的應用、場景、數(shù)據(jù)的供給,滿足我所有「閱后即焚」或者陪伴我一段時間的需求。
張鵬:兩位剛好在不同的角度:大廠和創(chuàng)業(yè)公司,來做 AI Coding 這件事,心態(tài)上會有什么不同?
宿文:我覺得無論大廠或者創(chuàng)業(yè)公司、共識或者非共識,這個事大家賺錢的概率是差不多的,都是小概率事件。
創(chuàng)業(yè)之后會聚焦到一個項目上,會考慮很多事情,從軟件工程和目前模型的邊界等等,因為技術世界,菜是原罪,你要接受淘汰。但同時,你不是為了淘汰而來的,你要拼盡全力,看清楚技術的卡點在哪、要解決的工程問題在哪、商業(yè)化問題等等,每一個方面都要考慮。
石揚:我覺得字節(jié)還是一個非常創(chuàng)業(yè)文化的公司,尤其是在這種創(chuàng)新業(yè)務上,我相信不管是我剛才講的想法,還是我每天講的,可能 100% 都是錯的。在這個環(huán)境中,允許不斷試錯,從錯誤里學到更多的東西,在這一點上其實跟我以前創(chuàng)業(yè)沒有特別大的區(qū)別。
當然比如創(chuàng)業(yè)要考慮你的錢是哪里來的,在大廠里面資源可能相對充足。
張鵬:MarsCode 今天在探索復雜任務下的編程自動化時,會遇到哪些挑戰(zhàn)?
石揚:每天面臨著無數(shù)的挑戰(zhàn),首先 AI 和大模型這件事情本身就是非常難的。
第二,如果有足夠多的錢就能贏,我相信世界上就不再有創(chuàng)業(yè)公司了,所有的巨頭都是從創(chuàng)業(yè)公司生長起來的,最難的還是認知。認知是平等的,每一個人每天只有 24 小時,只能獲得或者處理這么多信息。如何獲得認知對我們來說也是一個極端的挑戰(zhàn)。
其次是用戶,如果沒有足夠的用戶驗證想法,我覺得它是很難的。如何洞察用戶的需求,并且能夠基于現(xiàn)在模型的能力,滿足用戶需求,這也非??简灝a(chǎn)品功力。未來可能 GPT 20 出來之后,AGI 發(fā)生了,生成代碼是非常容易的一件事情,但基于今天的模型現(xiàn)狀滿足當下需求,也是一個挑戰(zhàn)。
最后是速度,試錯的速度。我覺得我們現(xiàn)在的狀態(tài)還是不夠快,不如很多創(chuàng)業(yè)公司如此之敏捷。如何能夠加快在試錯的次數(shù)、試錯的效率,以及從錯誤中學習的能力,也是每天需要思考的問題。
張鵬:預測在 2025 年 AI Coding 領域里面還會有什么變化?
石揚:從行業(yè)上看,我期待更好的模型能力能夠釋放出來,我們能夠把這些更好的模型能力,轉(zhuǎn)化成交付給用戶手里的生產(chǎn)力。最近行業(yè)的進展,無論從模型的推理能力、性能、速度,包括 OpenAI o3 雖然只是預告片,但都能看到很多的細節(jié),非常令人期待。
第二,也期待有更多人參與到代碼生成的行業(yè)里,因為只有更多優(yōu)秀的人加入到這個行業(yè),才會迸發(fā)出更多的想法。大家在競爭中共同進步,對手足夠強大,你才找到了更多的真正用戶,以及能夠打動用戶的需求。
張鵬:2025 年,對 MarsCode 有什么期待?
石揚:整個去年 MarsCode 已經(jīng)發(fā)了一款編程助手的插件,同時有云版本的 IDE 版本。2025 年估計每個季度都會有一些新的產(chǎn)品能力、產(chǎn)品形態(tài)釋放出來,也非常期待 MarsCode 能夠滿足更多用戶的需求。目前可以看到大量用戶的需求是未被滿足的,整個行業(yè)無論是從資本,做這件事情的團隊以及用戶,對這件事情的期待都非常高。
過去一年 MarsCode 大概有 100 萬用戶,也特別期待老用戶繼續(xù)喜歡我們,更多新用戶能夠看到我們的進步,用我們的新產(chǎn)品。做產(chǎn)品最大的快樂其實也來自于做出一個有價值的產(chǎn)品,被更多人用到的產(chǎn)品。
張鵬:宿文,你認為 2025 年這個行業(yè)有可能出現(xiàn)什么樣新的亮點和變化?
宿文:目前模型和代碼應用的發(fā)展可能稍微有點異步,期待明年有比較大的進展,不管是模型還是 Coding,我們更愿意把這兩件事等價起來,盡管距離手機時代的 iPhone 時刻還很遙遠。
近期看到特別有意思的一段《悟空傳》里面的一句話,「人在最有價值的時刻不是功成名就的時候」,我覺得大模型、AI Coding 最有價值的時刻,也不是到最后我們把 AI Coding 變成平權化的那個節(jié)點,而是在今天的條件下,怎么做決策。當然也會面臨巨大的不確定性和競爭,但反而會是很有價值的一年。
張鵬:AutoCoder 接下來會有哪些階段性的進展和值得期待的變化?
宿文:一個是準確率,對于大家表達的意圖和需求,在軟件里可以準確地、結(jié)構化地被模型識別。這一點上,整個軟件架構上會有很多提升準確率的實現(xiàn)方式。
另外是靈活性,在代碼生成時,程序員從每一個方程、每一個函數(shù)或者其他的形式開始寫,這里面是有巨大的靈活性的,如何完善靈活的使用場景,能夠讓產(chǎn)品經(jīng)理也直接用,是需要完善的。
最后是完善度,我們會首次在 AutoCoder 產(chǎn)品里覆蓋從數(shù)據(jù)庫、到后端和前端的一體化生成,大家使用的體驗會更流暢、更深度。我們更愿意做一個嚴肅的產(chǎn)品,讓大家的感知和體驗都更好。
AI 的終極目標是讓普通人也能享受編程的樂趣,讓不會代碼的人也能通過 AI 來實現(xiàn)需求,所以這應該是大家的終極目標,只是根據(jù)他們今天的起點和面對的用戶人群以及場景的不同,選擇了不同的切入點。
有些產(chǎn)品是從專業(yè)的用戶出發(fā)解決專業(yè)程序員的編程和協(xié)作問題,解決自動化的問題,最后能夠直接輸出產(chǎn)品,有一部分是直接面對普通用戶,輔助他們完成專業(yè)的編程,甚至直接輸出產(chǎn)品。