Unity 近日發(fā)布了 Unity 計(jì)算機(jī)視覺數(shù)據(jù)集,該數(shù)據(jù)集將有效降低計(jì)算機(jī)視覺應(yīng)用的開發(fā)成本,加快為制造業(yè)、零售業(yè)和安防行業(yè)訓(xùn)練人工智能(AI)的速度。計(jì)算機(jī)視覺方案提供商現(xiàn)在可以為其 AI 訓(xùn)練需求購(gòu)買定制化的數(shù)據(jù)集,同時(shí)保證符合嚴(yán)格的隱私和監(jiān)管標(biāo)準(zhǔn)。
對(duì)于人工智能訓(xùn)練來說合成數(shù)據(jù)非常重要,因?yàn)橥F(xiàn)實(shí)世界所收集的真實(shí)數(shù)據(jù)無法滿足特定的條件或需求。比如隱私規(guī)定限制了真實(shí)數(shù)據(jù)的可用性,或規(guī)定了數(shù)據(jù)只能以何種方式被使用。合成數(shù)據(jù)的一種常見用途是用于預(yù)發(fā)布的產(chǎn)品測(cè)試,此時(shí)現(xiàn)實(shí)數(shù)據(jù)可能不存在或無法被測(cè)試人員獲取。此外,機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)用于訓(xùn)練算法,這也有賴于合成數(shù)據(jù)。因?yàn)樵诂F(xiàn)實(shí)生活中,尤其是在自動(dòng)駕駛汽車行業(yè),生成能夠用于算法訓(xùn)練的數(shù)據(jù)非常昂貴。如今 Unity 已經(jīng)推出了計(jì)算機(jī)視覺數(shù)據(jù)集,未來在獲取用于人工智能和機(jī)器學(xué)習(xí)訓(xùn)練的高質(zhì)量合成數(shù)據(jù)集上,成本將不再是障礙。
由 Unity 引擎合成的逼真圖像可以描繪自動(dòng)駕駛場(chǎng)景中可能發(fā)生的各種低概率事件,從而改善自動(dòng)駕駛系統(tǒng)的訓(xùn)練效果
“通過提供符合隱私規(guī)定且如實(shí)反映真實(shí)世界的合成數(shù)據(jù),我們能夠讓這些具有開創(chuàng)性的數(shù)據(jù)集為更多創(chuàng)新者所用。根本上來說,這些數(shù)據(jù)集能幫助企業(yè)規(guī)劃和模擬尚未出現(xiàn)過的場(chǎng)景,甚至能夠模擬真實(shí)世界的用戶增長(zhǎng)來不斷調(diào)整訓(xùn)練數(shù)據(jù)。因此,隨著客戶應(yīng)用領(lǐng)域的擴(kuò)展,我們將能看到更智能的室內(nèi)環(huán)境,比如全自助無人零售店等等?!?Unity 人工智能和機(jī)器學(xué)習(xí)高級(jí)副總裁 Danny Lange 博士表示,“合成數(shù)據(jù)正在徹底改變機(jī)器學(xué)習(xí)模型的訓(xùn)練方式,它彌補(bǔ)了人工收集和標(biāo)記真實(shí)世界數(shù)據(jù)的許多不足之處。我們正在探索一切可能性,幫助創(chuàng)作者們獲取他們決策所需、并且負(fù)擔(dān)得起的數(shù)據(jù),推動(dòng) Unity 技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。這也是為什么我們推出這些數(shù)據(jù)集,并竭力幫助客戶滿足他們的需求?!?/span>
給物品“帖上”正確的標(biāo)簽
圖像掃描而成的物品
合成數(shù)據(jù)擁有諸多優(yōu)勢(shì),但是上手可能并不輕松:該技術(shù)本身對(duì)許多機(jī)器學(xué)習(xí)從業(yè)者來說都略顯新鮮,而為研究對(duì)象制作一整套的 3D 資源也是耗時(shí)耗力。
而由我們制作的 3D 資源皆為定制資源,每個(gè)導(dǎo)入 Unity 的數(shù)據(jù)集都會(huì)匹配模型的具體訓(xùn)練需求。有 3D 模型的,可轉(zhuǎn)換成 CAD 模型,沒有模型的,我們會(huì)使用先進(jìn)的圖像掃描技術(shù)來掃描現(xiàn)實(shí)物品,或交由專業(yè)藝術(shù)團(tuán)隊(duì)制作 3D 數(shù)字孿生。
各類帶標(biāo)簽的合成圖像數(shù)據(jù)
在制作完 3D 模型后,我們?cè)僦贫ㄙY源每幀上的行為、加上正確的標(biāo)簽。Unity 使用“域隨機(jī)化”(domain randomization)技術(shù)來創(chuàng)建各種計(jì)算機(jī)視覺數(shù)據(jù)集,以此來提高數(shù)據(jù)質(zhì)量并控制實(shí)際應(yīng)用中的偏差值。在合成數(shù)據(jù)的過程中,該技術(shù)將對(duì)目標(biāo)物體的位置和朝向進(jìn)行各種排列組合,還有光照和攝像機(jī)角度的變化,以及可能實(shí)現(xiàn)的 Unity 環(huán)境的無數(shù)變量配置等。而且,Unity 的合成數(shù)據(jù)集還可以避免真實(shí)數(shù)據(jù)獲取過程中可能存在的隱私違規(guī)或不可控的人工偏差。比如有些包含真實(shí)的人或地點(diǎn)的圖像是直接從互聯(lián)網(wǎng)上非法抓取的,或是花費(fèi)大量人力從真實(shí)世界中拍攝獲得。
動(dòng)態(tài)的環(huán)境
環(huán)境隨機(jī)化
數(shù)據(jù)集項(xiàng)目中的每個(gè)環(huán)境要素都可以隨機(jī)化:光照、紋理、攝像機(jī)位置、鏡頭屬性、信號(hào)噪波等等皆可改變,用多樣化的數(shù)據(jù)集來應(yīng)對(duì)最為廣泛的用例。
在使用合成數(shù)據(jù)時(shí),組成數(shù)據(jù)環(huán)境的背景并不一定要反映現(xiàn)實(shí)。部分計(jì)算機(jī)視覺的應(yīng)用可能還需高度隨機(jī)的背景,當(dāng)然也有需要一定背景結(jié)構(gòu)的情況存在,比如建筑或住宅內(nèi)部。
無結(jié)構(gòu)與結(jié)構(gòu)化的合成環(huán)境
我們團(tuán)隊(duì)已開發(fā)出一系列針對(duì)各種應(yīng)用的無結(jié)構(gòu)與結(jié)構(gòu)化合成環(huán)境制作方法,專家們將針對(duì)不同的問題、情景和數(shù)據(jù)范圍推薦環(huán)境類型。
數(shù)據(jù)集規(guī)模可大可小
不同的應(yīng)用有不同的數(shù)據(jù)要求,圖像的數(shù)量取決于場(chǎng)景復(fù)雜度、物品品類數(shù)和方案精確度。我們將深入理解客戶的需求,幫助劃定項(xiàng)目的框架,與客戶多次交流來保證數(shù)據(jù)集達(dá)到標(biāo)準(zhǔn)。
我們計(jì)劃在未來提供一個(gè)自助式接口,讓用戶能自行生成額外數(shù)據(jù),不必再依賴 Unity 團(tuán)隊(duì)。
服務(wù)價(jià)格分為多個(gè)階梯,不同數(shù)據(jù)量報(bào)價(jià)不同,幫助你掌控預(yù)算。對(duì)于真實(shí)世界的數(shù)據(jù),標(biāo)注的價(jià)格隨著標(biāo)注類型的復(fù)雜性而增加。Unity 則提供了一個(gè)適用于任何標(biāo)簽類型的較低價(jià)格,客戶無論是為簡(jiǎn)單還是復(fù)雜的行業(yè)標(biāo)準(zhǔn)都將支付相同的標(biāo)簽價(jià)格,如 2D 和 3D 邊框盒、類別分割和實(shí)例分割。合成數(shù)據(jù)集是按等級(jí)定價(jià)模型收費(fèi)的,客戶所需合成的圖像數(shù)量越多,每幅圖像的價(jià)格越低。
了解更多關(guān)于 Unity 人工智能數(shù)據(jù)集,請(qǐng)?jiān)L問:
https://unity.com/products/computer-vision