微軟發(fā)布具有圖形接口的計(jì)算機(jī)視覺(jué)工具Vision Studio,讓用戶(hù)可以在不需要技術(shù)基礎(chǔ)下,探索、評(píng)估并且展示計(jì)算機(jī)視覺(jué)功能,官方提到,用戶(hù)可以試用和探索計(jì)算機(jī)視覺(jué)服務(wù),并在決定要部署后于自己的應(yīng)用程序中,應(yīng)用微軟所提供的客戶(hù)端函數(shù)庫(kù)和REST API。
針對(duì)圖像和視頻的分析、管理需求,微軟提供了計(jì)算機(jī)視覺(jué)API,供用戶(hù)能夠以高端算法處理媒體,并且取得需要的資訊,用戶(hù)只要上傳媒體資產(chǎn),或是指定媒體URL,Azure的計(jì)算機(jī)視覺(jué)服務(wù)就能以各種算法,以符合適戶(hù)需求的方式分析視覺(jué)內(nèi)容。
而Vision Studio可讓用戶(hù)在沒(méi)有技術(shù)支持下,快速地試用該計(jì)算機(jī)視覺(jué)服務(wù)。在Vision Studio中,每個(gè)計(jì)算機(jī)視覺(jué)功能都有一個(gè)或多個(gè)試用功能,用戶(hù)可以使用自己的圖像進(jìn)行測(cè)試,不過(guò)這項(xiàng)操作需要擁有Azure訂閱和認(rèn)知服務(wù)資源以進(jìn)行身份驗(yàn)證,要在不登錄的情況下使用Vision Studio,則可以使用微軟所提供的范例圖像進(jìn)行測(cè)試。
Vision Studio提供光學(xué)字符識(shí)別(OCR)功能,供用戶(hù)從圖像以及文件中,截取印刷或是手寫(xiě)文本。Vision Studio也能夠進(jìn)行空間分析,識(shí)別視頻里存在的人物以及人物的移動(dòng),并且產(chǎn)生其他系統(tǒng)可以回應(yīng)的事件。用戶(hù)也可以將Vision Studio用于人臉識(shí)別應(yīng)用,以偵測(cè)、識(shí)別和分析圖像中的人臉,官方提到,人臉識(shí)別的用途非常廣泛,包括身份驗(yàn)證、非接觸式訪(fǎng)問(wèn)控制和隱私臉部模糊等都用得上。
Vision Studio的圖像分析功能則可從圖像中,截取許多視覺(jué)特征,包括對(duì)象、臉部、成人內(nèi)容,甚至是自動(dòng)生成文本描述以改進(jìn)無(wú)障礙功能,用戶(hù)可以在Vision Studio中,嘗試使用自己的圖像,以準(zhǔn)確識(shí)別對(duì)象、內(nèi)容,并且替圖像生成圖說(shuō)。