從商業(yè)問(wèn)題到落地應(yīng)用,Line靠六階段方法論打造ML應(yīng)用

來(lái)源:十輪網(wǎng)
作者:十輪網(wǎng)
時(shí)間:2024-11-03
1387
每一項(xiàng)ML系統(tǒng),都是因一個(gè)商業(yè)問(wèn)題而存在,這正是Line購(gòu)物大力擁抱AI的目標(biāo),他們最關(guān)鍵的商業(yè)問(wèn)題是提升銷售額,而機(jī)器學(xué)習(xí)團(tuán)隊(duì)的任務(wù),就是想辦法用ML來(lái)提高銷售額。

6EF57186-773A-4B19-8920-4C721086EE85.jpeg

每一項(xiàng)ML系統(tǒng),都是因一個(gè)商業(yè)問(wèn)題而存在,這正是Line購(gòu)物大力擁抱AI的目標(biāo),他們最關(guān)鍵的商業(yè)問(wèn)題是提升銷售額,而機(jī)器學(xué)習(xí)團(tuán)隊(duì)的任務(wù),就是想辦法用ML來(lái)提高銷售額。

不過(guò),從商業(yè)問(wèn)題出發(fā),到落地成為一支AI應(yīng)用,Line開(kāi)發(fā)團(tuán)隊(duì)有一套自己的方法論,這是一套涵蓋了整個(gè)機(jī)器學(xué)習(xí)(ML)生命周期的開(kāi)發(fā)流程,從定義問(wèn)題、將問(wèn)題轉(zhuǎn)為ML問(wèn)題、建模、執(zhí)行AB測(cè)試、評(píng)估和決策等環(huán)節(jié)。

用ML方法解決商業(yè)問(wèn)題

Line機(jī)器學(xué)習(xí)工程師黃昱睿指出,團(tuán)隊(duì)接到商業(yè)需求時(shí),先從定義問(wèn)題開(kāi)始,以提升銷售額的需求為例,考量了設(shè)計(jì)新產(chǎn)品、推行折價(jià)券和提高用戶體驗(yàn)等3種實(shí)現(xiàn)策略,最終選擇ML可行性最高的第三種。

那么,如何利用ML方法,來(lái)兼顧獲利(即訂單成交量)與用戶體驗(yàn),開(kāi)發(fā)團(tuán)隊(duì)從Line購(gòu)物用戶旅程找切入點(diǎn)。由于Line購(gòu)物屬于導(dǎo)購(gòu)平臺(tái),專門提供商品、文章等頁(yè)面,來(lái)引導(dǎo)顧客到商品店家平臺(tái),同時(shí)在過(guò)程中提供點(diǎn)數(shù)優(yōu)惠或反饋,因此用戶購(gòu)物旅程會(huì)經(jīng)歷:頁(yè)面瀏覽、點(diǎn)擊有興趣的商品/商店/文章、頁(yè)面跳轉(zhuǎn)至商家商品、最終下單。

在這段旅程中,Line鎖定下單前的“點(diǎn)擊有興趣商品”,作為ML問(wèn)題切入點(diǎn)。也就是說(shuō),Line要預(yù)測(cè)用戶有興趣的商品,并在對(duì)的時(shí)間推薦給他們,來(lái)提高點(diǎn)擊率。

為進(jìn)一步將這個(gè)概念轉(zhuǎn)換為可行的ML方法,Line團(tuán)隊(duì)先進(jìn)行2個(gè)數(shù)據(jù)面分析。首先是推薦時(shí)間點(diǎn),若鎖定用戶操作“當(dāng)下”想購(gòu)買的商品,就得依據(jù)用戶過(guò)去購(gòu)買的數(shù)據(jù)來(lái)訓(xùn)練模型,好讓模型預(yù)測(cè)有興趣的商品。但這類數(shù)據(jù)量少,會(huì)造成模型過(guò)度學(xué)習(xí),進(jìn)而影響推薦效果和用戶體驗(yàn)。

另一個(gè)考量是,模型要根據(jù)點(diǎn)擊次數(shù)來(lái)推薦商品,還是用戶“會(huì)點(diǎn)擊”的商品來(lái)推薦?也就是說(shuō),這個(gè)推薦模型該采用回歸模型,還是分類模型。

“我們最后選擇分類模型,”黃昱睿解釋,電商場(chǎng)景中,通常有群重度用戶,他們的熱門商品點(diǎn)擊率和消費(fèi)額遠(yuǎn)大于一般用戶,因此以點(diǎn)擊次數(shù)來(lái)推薦商品,就會(huì)過(guò)于偏頗。

于是,團(tuán)隊(duì)將ML問(wèn)題調(diào)整為“用戶未來(lái)幾天會(huì)點(diǎn)擊的商品”,不僅能解決因數(shù)據(jù)稀疏、模型過(guò)度學(xué)習(xí)的問(wèn)題,還能提前秀出用戶想要的商品,優(yōu)化用戶體驗(yàn)。

這就是Line團(tuán)隊(duì)將商業(yè)問(wèn)題,轉(zhuǎn)換為ML問(wèn)題的過(guò)程。

建模靠5步驟,完成還得不斷迭代

有了ML問(wèn)題,接下來(lái)就是建模。建模一般有5個(gè)步驟,包括特征工程、集成模型數(shù)據(jù)、模型訓(xùn)練、模型推論,以及脫機(jī)評(píng)估。

在特征工程階段,Line認(rèn)為,頁(yè)面瀏覽、點(diǎn)擊和下單這類用戶行為,是決定點(diǎn)擊購(gòu)買商品的關(guān)鍵。但光有這些特征還不夠,還得與其他特征做交叉群組計(jì)算,比如,年齡30歲至40歲點(diǎn)擊網(wǎng)站的次數(shù),交叉比對(duì)年齡30歲至40歲且是男性、點(diǎn)擊該網(wǎng)站的次數(shù),又或是再交叉比對(duì)其他屬性。

多了這些資訊,就能協(xié)助團(tuán)隊(duì)更準(zhǔn)確觀察,用戶在特定時(shí)間是否會(huì)點(diǎn)擊該商品。尤其,黃昱睿點(diǎn)出,這種交叉計(jì)算資訊,可以補(bǔ)足同一個(gè)特征未必持續(xù)有效的缺陷。完成特征工程后,就可以進(jìn)行模型數(shù)據(jù)的集成,準(zhǔn)備進(jìn)入訓(xùn)練模型的階段。

不同模型的訓(xùn)練方式各有不同,但黃昱睿點(diǎn)出,模型訓(xùn)練有2個(gè)常見(jiàn)要點(diǎn),包括各項(xiàng)指標(biāo)需與基準(zhǔn)相比,以及比較多組模型成效。其中,這個(gè)基準(zhǔn)可以是人工方法,也可以是傳統(tǒng)統(tǒng)計(jì)方法,ML工程師得觀察采用模型后,指標(biāo)表現(xiàn)是否逐步提升。

在推論部分,因Line購(gòu)物推薦模型,主要比對(duì)用戶嵌入矢量和商品嵌入矢量的相關(guān)性來(lái)推薦,進(jìn)行推論時(shí)得同時(shí)考慮矢量大小和推論時(shí)間。

“矢量小、維度低,數(shù)據(jù)量少,推論速度快,”黃昱睿解釋,矢量大則相反,因此如何拿捏矢量大小與推論時(shí)間,得看應(yīng)用場(chǎng)景和準(zhǔn)確度等其他數(shù)據(jù)來(lái)決定。

最后則是脫機(jī)評(píng)估,就像是模型的“模擬考”,來(lái)確認(rèn)模型學(xué)習(xí)成效,以及是否太貼近訓(xùn)練數(shù)據(jù)、難以應(yīng)對(duì)新資訊等問(wèn)題。

這就是Line購(gòu)物推薦模型的建模5步驟。不過(guò),一套模型得要多次執(zhí)行這些步驟、不斷迭代,才能達(dá)到真正可用程度。因此黃昱睿表示,善用YAML配置文件輔助,可加速這個(gè)過(guò)程,節(jié)省工程師手動(dòng)設(shè)置時(shí)間。

AB測(cè)試有4要點(diǎn)

接下來(lái)就是AB測(cè)試環(huán)節(jié)。在這個(gè)階段,Line團(tuán)隊(duì)會(huì)將模型新做法和舊做法分為實(shí)驗(yàn)組和對(duì)照組,來(lái)處理用戶或?yàn)g覽記錄資訊,比較兩種做法的推薦成效。

黃昱睿提醒有4個(gè)AB測(cè)試的基本概念,包括用戶要均勻分布,如隨機(jī)分組就是一種方法。再來(lái),在同個(gè)實(shí)驗(yàn)中,用戶組別要固定,比如在一段時(shí)間內(nèi),登錄網(wǎng)站的同一位用戶,都要固定在A組。

第三,若同個(gè)實(shí)驗(yàn)中,實(shí)驗(yàn)比率增加,如實(shí)驗(yàn)范圍從10%擴(kuò)大至20%時(shí),實(shí)驗(yàn)組的成員不變,即不能重新分組。最后,由于推薦系統(tǒng)屬于線上應(yīng)用場(chǎng)景,因此測(cè)試時(shí),要確保API也能高效率執(zhí)行。

每次AB測(cè)試時(shí),Line還會(huì)為每次輸入的瀏覽記錄,粘貼一個(gè)標(biāo)簽(Tag),存儲(chǔ)至數(shù)據(jù)庫(kù)后,可進(jìn)行后續(xù)分析。同理,他們也會(huì)在每次的瀏覽記錄中,加入一些資訊,比如這次實(shí)驗(yàn)的唯一代碼,方便后續(xù)做不同實(shí)驗(yàn)的比較。

評(píng)估帶來(lái)的ML反思

有了實(shí)驗(yàn)組和對(duì)照組后,就進(jìn)入黃昱睿認(rèn)為ML生命周期中“最重要的”階段:評(píng)估。在這個(gè)階段,Line關(guān)注的評(píng)估指標(biāo)有ML指標(biāo)和商業(yè)指標(biāo),如ML的精確度、平均排名倒數(shù),或是商業(yè)的點(diǎn)擊率、轉(zhuǎn)化率、交易轉(zhuǎn)量等,不僅能讓非技術(shù)的高層主管理解ML效益,也能衡量ML是否解決了商業(yè)問(wèn)題。

黃昱睿接著說(shuō)明,要是評(píng)估發(fā)現(xiàn)ML指標(biāo)表現(xiàn)亮眼,但商業(yè)指標(biāo)沒(méi)有起色,這可能意味著,“原本定義的ML問(wèn)題,沒(méi)有打中要害?!?/p>

他以自己多年前的一項(xiàng)Email營(yíng)銷項(xiàng)目為例,他與團(tuán)隊(duì)打造一套ML模型,來(lái)預(yù)測(cè)用戶是否點(diǎn)擊Email內(nèi)容。

當(dāng)時(shí)評(píng)估發(fā)現(xiàn),模型預(yù)測(cè)精確度很高,但購(gòu)買率還是很低。這是因?yàn)?,?dāng)初團(tuán)隊(duì)開(kāi)發(fā)模型,只考量用戶是否點(diǎn)擊,并未納入后續(xù)的購(gòu)買、成交等消費(fèi)行為,這時(shí)就得回過(guò)頭去定義問(wèn)題。

不只如此,黃昱睿在后來(lái)一次次的評(píng)估中,觀察到推薦模型的特征相關(guān)性,與原本想象的特征,有很大的不同。

Line購(gòu)物推薦模型是用來(lái)預(yù)測(cè)用戶會(huì)點(diǎn)擊的商品,照常理來(lái)說(shuō),點(diǎn)擊行為應(yīng)該是推薦成功與否,最相關(guān)的特征。但他后來(lái)發(fā)現(xiàn),并非如此,因?yàn)辄c(diǎn)擊并不是用戶完全主動(dòng)的行為,而是網(wǎng)站先呈現(xiàn)內(nèi)容,用戶才能點(diǎn)擊。“主動(dòng)搜索,才是相關(guān)性最高的特征。”他坦言。也因此,Line后來(lái)強(qiáng)化購(gòu)物推薦模型時(shí),打算納入更多與搜索相關(guān)的特征。

黃昱睿建議,開(kāi)發(fā)者在構(gòu)建推薦模型前,可先分析主動(dòng)事件和被動(dòng)事件,再找尋相關(guān)特征,如此打造的推薦模型,效果會(huì)更好。

上線后需監(jiān)控ML性能與商業(yè)指標(biāo)

推薦模型經(jīng)評(píng)估可行、正式部署上線后,Line團(tuán)隊(duì)還有套監(jiān)控機(jī)制,時(shí)時(shí)把關(guān)模型性能。

監(jiān)控指標(biāo)不只有特征、ML性能指標(biāo),還要有商業(yè)指標(biāo),比如訂單量、點(diǎn)擊率,才能找出問(wèn)題和改進(jìn)方法。比如,用戶每天的商品點(diǎn)擊率遞減,團(tuán)隊(duì)可從該商業(yè)指標(biāo)發(fā)現(xiàn)問(wèn)題,順藤摸瓜找出推薦模型性能逐退下降原因,介入調(diào)整。

黃昱睿點(diǎn)出,理想的推薦系統(tǒng)生命周期,應(yīng)該由ML工程師和產(chǎn)品負(fù)責(zé)人一起合作維護(hù)?!坝袝r(shí)候推薦效果不好,不只是推薦的原因,”他舉例,曾經(jīng)做過(guò)流失分析,就算對(duì)流失用戶發(fā)送優(yōu)惠券,用戶仍不買單。這時(shí),就需要ML工程師與產(chǎn)品負(fù)責(zé)人共同討論,比如重新設(shè)計(jì)或重新建模,來(lái)提高推薦成功率。

“最理想的狀況是,工程師、產(chǎn)品負(fù)責(zé)人,甚至是企業(yè)中更多組織加入這整個(gè)ML生命周期,就能做出更完整的產(chǎn)品或服務(wù),”他總結(jié)。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于十輪網(wǎng),本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
相關(guān)文章
iOS版開(kāi)LINE貼圖手機(jī)畫(huà)面全白,官方公布7項(xiàng)解套辦法
iOS版開(kāi)LINE貼圖手機(jī)畫(huà)面全白,官方公布7項(xiàng)解套辦法
蘋(píng)果用戶近期發(fā)現(xiàn),在iOS版通信軟件LINE打開(kāi)TODAY或貼圖小舖時(shí),可能發(fā)生畫(huà)面顯示全白或錯(cuò)誤消息而無(wú)法正常打開(kāi)。
iOS
Line
海外營(yíng)銷
2024-12-27
Line推出RMN服務(wù),結(jié)合第一方生態(tài)圈與第三方消費(fèi)數(shù)據(jù)來(lái)支持精準(zhǔn)營(yíng)銷
Line推出RMN服務(wù),結(jié)合第一方生態(tài)圈與第三方消費(fèi)數(shù)據(jù)來(lái)支持精準(zhǔn)營(yíng)銷
11月27日,Line宣布推出Line RMN Solution數(shù)字廣告服務(wù),利用Line購(gòu)物、Line Beacon等第一方數(shù)據(jù),以及統(tǒng)一集團(tuán)1,800萬(wàn)名Open Point會(huì)員數(shù)據(jù),來(lái)支持廣告精準(zhǔn)投放。
Line
海外營(yíng)銷
海外推廣
2024-12-12
LINE相冊(cè)因程序錯(cuò)誤出現(xiàn)不相關(guān)照片影響近25萬(wàn)用戶
LINE相冊(cè)因程序錯(cuò)誤出現(xiàn)不相關(guān)照片影響近25萬(wàn)用戶
通信軟件LINE的相冊(cè)功能上月出問(wèn)題,造成部分用戶的照片變成其他不相干用戶相冊(cè)的縮略圖,運(yùn)營(yíng)商日本LY Corporation今天估計(jì),日本海內(nèi)外估計(jì)約24萬(wàn)9,000人受影響。
Line
2024-12-12
LINE Pay購(gòu)好券全新上線,商家可簡(jiǎn)化發(fā)票券流程
LINE Pay購(gòu)好券全新上線,商家可簡(jiǎn)化發(fā)票券流程
LINE Pay宣布推出全新服務(wù)“LINE Pay購(gòu)好券”,提供合作商店通過(guò)LINE Pay平臺(tái)一站式輕松發(fā)行商品票券。
Line
移動(dòng)支付
2024-12-12
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開(kāi)掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家