據(jù)外媒TechCrunch報(bào)道,每一張發(fā)布到Facebook和Instagram上的圖片都會(huì)有一個(gè)圖像分析人工智能生成的標(biāo)題,而且Facebook已對(duì)這一人工智能技術(shù)進(jìn)行升級(jí)。改進(jìn)后的系統(tǒng)對(duì)于視障用戶(hù)來(lái)說(shuō)應(yīng)該是一種享受,未來(lái)可能會(huì)幫助用戶(hù)更快地找到照片。
轉(zhuǎn)換文字是圖像元數(shù)據(jù)中描述其內(nèi)容的一個(gè)字段:“一個(gè)人和田野里的一匹馬”或"船上的一條狗"。這可以讓看不到圖像的人也能理解圖像的內(nèi)容。
這些描述通常是由攝影師或出版物手動(dòng)添加的,但人們將照片上傳到社交媒體上時(shí),一般不會(huì)去做。因此,相對(duì)來(lái)說(shuō),最近能夠自動(dòng)生成的描述對(duì)于讓社交媒體更容易被大眾所接受是非常有幫助的。
Facebook在2016年創(chuàng)建了自動(dòng)轉(zhuǎn)換文本系統(tǒng)。此后,團(tuán)隊(duì)對(duì)其進(jìn)行了許多改進(jìn),使其更快、更詳細(xì),最新的更新增加了一個(gè)選項(xiàng),可以根據(jù)需求生成更詳細(xì)的描述。改進(jìn)后的系統(tǒng)識(shí)別的項(xiàng)目和概念比一開(kāi)始多了10倍,現(xiàn)在大約有1200個(gè)。而且描述中包含了更多的細(xì)節(jié)。曾經(jīng)的“兩個(gè)人在建筑物旁”的描述現(xiàn)在可能是“兩個(gè)人在埃菲爾鐵塔旁的自拍”。
但還有比這更多的細(xì)節(jié),即使它不一定相關(guān)。例如,在這張圖片中,AI會(huì)注意到人和物體的相對(duì)位置:
要在Facebook應(yīng)用中訪問(wèn)這些詳細(xì)的圖像描述,在Android中長(zhǎng)按照片,在iOS中使用照片上的"自定義操作"。新的詳細(xì)描述功能將首先來(lái)到Facebook進(jìn)行測(cè)試,不過(guò)改進(jìn)后的詞匯很快就會(huì)出現(xiàn)在Instagram上。描述的內(nèi)容也保持簡(jiǎn)單,因此可以很容易地翻譯成其他應(yīng)用已經(jīng)支持的語(yǔ)言,不過(guò)該功能可能不會(huì)在其他國(guó)家同時(shí)推出。