2018年,F(xiàn)acebook的團隊遇到了一個難題。根據(jù)舉報人Frances Haugen公布的文件了解到,柬埔寨用戶占Messenger語音功能全球總流量的近50%,但這家公司卻沒有人知道原因。
根據(jù)Rest of World查看的內(nèi)部文件,一名員工建議進行一次調(diào)查。他們想知道,這是否跟識字率低有關(guān)?同一份文件顯示,在2020年,F(xiàn)acebook的一項研究試圖詢問音頻使用量大的國家的用戶,但只能找到一個柬埔寨的受訪者。這個謎團,似乎一直沒有解開。
現(xiàn)在,令人驚訝的是,答案跟Facebook的關(guān)系不大,而是跟高棉語的復(fù)雜性以及用戶適應(yīng)一項從未考慮過的技術(shù)的方式有關(guān)。
在柬埔寨,從嘟嘟車司機到首相洪森,每個人都喜歡發(fā)送語音筆記而不是信息。Facebook的研究顯示,不僅僅是柬埔寨人喜歡語音信息--盡管沒有其他地方比它更受歡迎,在這項研究中,包括來自多米尼加共和國、塞內(nèi)加爾、貝寧、象牙海岸的30名用戶以及那位單一的柬埔寨人,87%的受訪者表示,他們使用語音工具來發(fā)送跟他們應(yīng)用上設(shè)置的語言不同的筆記。WhatsApp--調(diào)查對象中最受歡迎的平臺--以及Messenger和Telegram上面的情況都是如此。
最常見的原因之一是什么呢?--打字太難了。
在柬埔寨的情況下,從來沒有一個簡單的方法來輸入高棉語。雖然高棉語Unicode很早就被標準化了,但在2006年至2008年間,鍵盤本身卻落后了。第一個高棉語電腦鍵盤的開發(fā)者必須適應(yīng)該語言的74個字符,這是世界上所有文字中最多的。
這顯然是一項艱巨的任務(wù)。Javier Sola是一位出生在西班牙、居住在金邊的計算機科學家,他是2005年最初高棉操作系統(tǒng)項目的團隊成員。
現(xiàn)任柬埔寨非政府組織Open Institue執(zhí)行主任Sola告訴Rest of World:“高棉語的符號比拉丁文多得多。”在拉丁文鍵盤上,用戶可以一次看到所有的字母,這使打字變得直觀。但在高棉語中,每個鍵都有兩個不同的字符,這需要在兩個鍵盤層之間反復(fù)翻轉(zhuǎn)。不僅如此,有限的字體意味著,如果收件人的電腦沒有跟發(fā)件人相同的字體,一些信息就無法出現(xiàn)。不過,用戶們還是成功了。
2009年左右,F(xiàn)acebook在柬埔寨開始流行,與此同時,廉價的智能手機和互聯(lián)網(wǎng)接入也開始出現(xiàn),這意味著它的使用量爆炸性增長。今天,它仍是該國最受歡迎的整體平臺。但在一個小的智能手機屏幕上,同樣的打字系統(tǒng)變得幾乎不可能。
2016年美國國際開發(fā)署的一份報告顯示,智能手機用戶更喜歡電話和語音信息,因為他們發(fā)現(xiàn)打字很困難、很費時間或因為他們對如何使用設(shè)備上的高棉文字感到困惑。一些受訪者甚至沒有意識到他們的設(shè)備支持這種語言。西方用戶認為理所當然的其他功能--如準確的拼寫檢查或光學字符識別--在高棉語中仍只具備基本的功能,這讓用戶對文字使用感到沮喪。
Sola表示:“現(xiàn)在有了稍微先進的鍵盤,但它們沒有預(yù)裝在手機上--跟Google、三星和微軟的鍵盤不同?!倍嗄陙恚藗兊牧晳T已經(jīng)硬化為接受。他稱,在柬埔寨,語音信息只是人們的選擇。
這不僅僅在Messenger。在柬埔寨其他流行的平臺上,諸如Telegram、WhatsApp和LINE,用戶也都喜歡用語音。雖然沒有來自Facebook的最新語音流量數(shù)據(jù),但在首都金邊的柬埔寨人告訴Rest of World,他們認識的絕大多數(shù)人都依靠語音工具來獲得便利和表達能力。用戶說,他們并不覺得在功能上受到欺騙,而是更喜歡發(fā)送和接收語音信息的輕松感覺。總的來說,他們對在公共場合說話并不感到害羞,在街上錄制信息也很自在。
創(chuàng)意行業(yè)的自由職業(yè)者Leng Len表示,這很難再回去了?!八梢赃M行最有機的表達,并且比打字更快?!?/p>
但對語音工具的依賴也產(chǎn)生了它自己的一系列特殊問題。對話變得短暫了。這些用戶還抱怨稱,他們無法回滾以回憶他們交流的細節(jié),只能通過記住他們留下的語音信息的具體模式來重放這些信息--比如一個長的和兩個短的。聊天記錄中的內(nèi)容不可能使用搜索功能。然而,與此同時,這種不便似乎并沒有超過其弊端?,F(xiàn)在的書面信息往往以商業(yè)或英語交流為主。
雖然Facebook的員工想象這種行為跟低文化水平有關(guān),但根據(jù)世界銀行的最新數(shù)據(jù),柬埔寨的識字率約為80%。
“許多年輕人,如果他們想打字,就會用拉丁文寫出高棉語單詞,”金邊的軟件工程師兼POSCAR數(shù)字公司CEO Sok Pongsametrey指出。POSCAR是一家為教育建立數(shù)字工具的公司。其他時候,如果一個字母太難拼寫,他們可能會采用更容易獲得的字符來錯誤地拼寫這個詞或用省略號來縮寫一個詞--因為他們知道讀者會理解這個隱含的詞。
這有連鎖反應(yīng)。Sok稱,這些類型的變通方法使從事機器學習的工程師更難用這種語言來訓(xùn)練人工智能。另外他還擔心,這些捷徑將意味著年輕人將失去對高棉文字的熟悉。
“當我用高棉語寫作時,我非常小心,因為這是一門藝術(shù),但是年輕人,他們認為(使用拉丁文本)非常容易,”Sok說道。
語音信息在柬埔寨的主流化引發(fā)了關(guān)于內(nèi)容控制和錯誤信息傳播的問題。音頻是出了名的難以掃描、缺乏上下文線索,且跟視頻相比,很難分辨它是否被篡改過。
音頻信息證據(jù)已在一些引人注目的案件中出現(xiàn),例如逃離柬埔寨的佛教活動家Luon Sovath,他稱柬埔寨當局捏造了有罪的信使錄音。
當被問及在柬埔寨進行這種調(diào)節(jié)的資源時,F(xiàn)acebook(現(xiàn)在稱為Meta)的一位代表只提到了一般的措施?!坝脩艨梢詧蟾鍹essenger上的任何內(nèi)容,包括語音信息,我們以高棉語為母語的團隊將對任何違反我們政策的內(nèi)容進行審查和強制執(zhí)行?!?/p>
發(fā)言人還提到了檢測有害視覺內(nèi)容的工具以及仇恨分類器,但沒有具體回答Rest of World關(guān)于音頻控制的問題。
Javier Sola指出,有一些較新的鍵盤如微軟的SwiftKey,讓高棉語輸入變得更容易一些,但許多柬埔寨人甚至不知道它們的存在。
柬埔寨只是一個市場,許多科技公司對開發(fā)更好的產(chǎn)品不感興趣?!八麄冊谶@里賺不到錢,所以他們不投資,”Sola說道。
為此,柬埔寨的用戶繼續(xù)適應(yīng)著這種模式。當被問及她是否認為語音信息會被更好的技術(shù)所取代時,Len表示懷疑--“我不這么認為。它有助于促進更有效的對話?!?/p>