TikTok背后的人工智能是如何運(yùn)作的?

來(lái)源:企業(yè)網(wǎng)D1Net
作者:Vivien H.
時(shí)間:2022-04-25
2712
TikTok是一款視頻分享應(yīng)用程序,可以讓用戶創(chuàng)建和分享短視頻。它以“只為你”的個(gè)性化推薦給用戶留下深刻印象。它非常容易上癮,在Z世代中很受歡迎,而人工智能技術(shù)是其背后采用的主要技術(shù)。

TikTok是一款視頻分享應(yīng)用程序,可以讓用戶創(chuàng)建和分享短視頻。它以“只為你”的個(gè)性化推薦給用戶留下深刻印象。它非常容易上癮,在Z世代中很受歡迎,而人工智能技術(shù)是其背后采用的主要技術(shù)。

20220425012927924.png

TikTok架構(gòu)

TikTok推薦系統(tǒng)的架構(gòu)包括三個(gè)組成部分:大數(shù)據(jù)框架、機(jī)器學(xué)習(xí)、微服務(wù)架構(gòu)。

(1)大數(shù)據(jù)框架是推薦系統(tǒng)的起點(diǎn)。它提供實(shí)時(shí)數(shù)據(jù)流處理、數(shù)據(jù)計(jì)算和數(shù)據(jù)存儲(chǔ)。

(2)機(jī)器學(xué)習(xí)是推薦系統(tǒng)的大腦。一系列機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法和技術(shù)被應(yīng)用于構(gòu)建模型,并生成適合個(gè)人偏好的建議。

(3)微服務(wù)架構(gòu)是讓整個(gè)系統(tǒng)快速高效服務(wù)的底層基礎(chǔ)設(shè)施。

大數(shù)據(jù)框架

沒(méi)有數(shù)據(jù),就沒(méi)有智慧。TikTok的大多數(shù)數(shù)據(jù)來(lái)自用戶的智能手機(jī)。這包括操作系統(tǒng)和安裝的應(yīng)用程序等。更重要的是,TikTok特別關(guān)注用戶的活動(dòng)日志,例如觀看時(shí)間、滑動(dòng)、點(diǎn)贊、分享和評(píng)論。

20220425013003400.png

日志數(shù)據(jù)通過(guò)Flume和scribe進(jìn)行收集和匯總,它們通過(guò)管道傳輸?shù)終afka隊(duì)列中。然后Apache Storm與Apache Hadoop生態(tài)系統(tǒng)中的其他組件實(shí)時(shí)處理數(shù)據(jù)流。

Apache Hadoop生態(tài)系統(tǒng)是一個(gè)用于數(shù)據(jù)處理和存儲(chǔ)的分布式系統(tǒng)。這包括第一代分布式數(shù)據(jù)處理系統(tǒng)MapReduce,它與批處理并行處理數(shù)據(jù)。YARN是一個(gè)用于作業(yè)調(diào)度和集群資源管理的框架;HDFS是一個(gè)分布式文件系統(tǒng);HBase是一個(gè)可擴(kuò)展的分布式數(shù)據(jù)庫(kù),支持大型表格的結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)。Hive是提供數(shù)據(jù)匯總和查詢的數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)設(shè)施。Zookeeper是一個(gè)高性能的協(xié)調(diào)服務(wù)。

隨著數(shù)據(jù)量的快速增長(zhǎng),實(shí)時(shí)數(shù)據(jù)處理框架應(yīng)運(yùn)而生。ApacheSpark是第三代框架,有助于對(duì)大數(shù)據(jù)工作負(fù)載進(jìn)行近乎實(shí)時(shí)的分布式處理。Spark通過(guò)在內(nèi)存中處理來(lái)增強(qiáng)MapReduce的性能。在過(guò)去的幾年里,TikTok應(yīng)用了第四代框架Flink。它旨在本地進(jìn)行實(shí)時(shí)流處理。

數(shù)據(jù)庫(kù)系統(tǒng)包括MySQL、MongoDB等。

機(jī)器學(xué)習(xí)

這就是TikTok如何獲得家喻戶曉的超個(gè)性化、令人上癮的算法的核心。在大量數(shù)據(jù)集涌入之后,接下來(lái)是內(nèi)容分析、用戶分析和場(chǎng)景分析。TensorFlow等神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)框架用于執(zhí)行計(jì)算機(jī)視覺(jué)和自然語(yǔ)言處理。計(jì)算機(jī)視覺(jué)將用照片和視頻破譯圖像。自然語(yǔ)言處理包括分類、標(biāo)簽和評(píng)估。

使用經(jīng)典的機(jī)器學(xué)習(xí)算法,包括邏輯回歸、卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)和梯度提升決策樹。應(yīng)用了常見的推薦方法,例如基于內(nèi)容的過(guò)濾、協(xié)同過(guò)濾和更高級(jí)的矩陣分解。

TikTok用來(lái)解讀人們思想的秘密武器是:

(1)算法實(shí)驗(yàn)平臺(tái):工程師對(duì)邏輯回歸、卷積神經(jīng)網(wǎng)絡(luò)等多種機(jī)器學(xué)習(xí)算法的混合進(jìn)行實(shí)驗(yàn),然后運(yùn)行測(cè)試(A/B測(cè)試)并進(jìn)行調(diào)整。

(2)廣泛的分類和標(biāo)簽:模型基于用戶的參與度,例如觀看時(shí)間、滑動(dòng)以及常用的點(diǎn)贊或分享(人們所做的作為通常是潛意識(shí)的反映)。用戶特征、向量和類別的數(shù)量超過(guò)了世界上大多數(shù)推薦系統(tǒng)都要多,而且它們還在不斷增加。

(3)用戶反饋引擎:在多次迭代檢索用戶反饋后更新模型。體驗(yàn)管理平臺(tái)是建立在這個(gè)引擎之上的,并最終改善了這些缺陷和建議。

為了解決推薦中的冷啟動(dòng)問(wèn)題,使用了召回策略。就是從數(shù)以千萬(wàn)計(jì)的視頻中挑選出數(shù)千名候選人,這些視頻已經(jīng)被證明是受歡迎的和高質(zhì)量的視頻。

與此同時(shí),一些人工智能工作已經(jīng)轉(zhuǎn)移到客戶端,以獲得超快的響應(yīng)。這包括在設(shè)備上進(jìn)行實(shí)時(shí)培訓(xùn)、建模和推理??蛻舳耸褂昧薚ensorFlow Lite或ByteNN等機(jī)器學(xué)習(xí)框架。

微服務(wù)架構(gòu)

TikTok采用了云原生基礎(chǔ)設(shè)施。用戶分析、預(yù)測(cè)、冷啟動(dòng)、召回和用戶反饋引擎等推薦組件用作API。這些服務(wù)托管在Amazon AWS和Microsoft Azure等云平臺(tái)中。作為系統(tǒng)的結(jié)果,視頻策展將通過(guò)云端推送給用戶。

TikTok采用基于Kubernetes的容器化技術(shù)。Kubernetes被稱為容器編排器,它是自動(dòng)化應(yīng)用程序生命周期的工具集。Kubeflow致力于在Kubernetes上部署機(jī)器學(xué)習(xí)工作流。

作為云原生堆棧的一部分,服務(wù)網(wǎng)格是另一種處理服務(wù)到服務(wù)通信的工具。它控制應(yīng)用程序的不同部分如何相互共享數(shù)據(jù)。它在平臺(tái)層而不是應(yīng)用程序?qū)硬迦牍δ芑蚍?wù)。

由于對(duì)高并發(fā)性的要求,這些服務(wù)是用Go語(yǔ)言和gRPC構(gòu)建的。在TikTok中,Go由于其良好的內(nèi)置網(wǎng)絡(luò)和并發(fā)支持而成為服務(wù)開發(fā)中的主導(dǎo)語(yǔ)言。gRPC是一個(gè)遠(yuǎn)程過(guò)程控制框架,用于高效地構(gòu)建和連接服務(wù)。

Tiktok的成功在于它會(huì)更加努力地提供最佳的用戶體驗(yàn)。他們構(gòu)建內(nèi)部工具以最大限度地提高低級(jí)別(系統(tǒng)級(jí)別)的性能。例如,ByteMesh是Service Mesh的改進(jìn)版本,KiteX是一個(gè)高性能的Golang gRPC框架,Sonic是一個(gè)增強(qiáng)的Golang JSON庫(kù)。其他內(nèi)部工具或系統(tǒng)包括參數(shù)服務(wù)器、ByteNN和abase等。

正如TikTok機(jī)器學(xué)習(xí)負(fù)責(zé)人所說(shuō),有時(shí)底層的基礎(chǔ)設(shè)施比其上面的(機(jī)器學(xué)習(xí))算法更重要。

立即登錄,閱讀全文
原文鏈接:點(diǎn)擊前往 >
文章來(lái)源:企業(yè)網(wǎng)D1Net
版權(quán)說(shuō)明:本文內(nèi)容來(lái)自于企業(yè)網(wǎng)D1Net,本站不擁有所有權(quán),不承擔(dān)相關(guān)法律責(zé)任。文章內(nèi)容系作者個(gè)人觀點(diǎn),不代表快出海對(duì)觀點(diǎn)贊同或支持。如有侵權(quán),請(qǐng)聯(lián)系管理員(zzx@kchuhai.com)刪除!
優(yōu)質(zhì)服務(wù)商推薦
更多
掃碼登錄
打開掃一掃, 關(guān)注公眾號(hào)后即可登錄/注冊(cè)
加載中
二維碼已失效 請(qǐng)重試
刷新
賬號(hào)登錄/注冊(cè)
個(gè)人VIP
小程序
快出海小程序
公眾號(hào)
快出海公眾號(hào)
商務(wù)合作
商務(wù)合作
投稿采訪
投稿采訪
出海管家
出海管家