IBM發(fā)布了開源工具包UQ360(Uncertainty Quantification 360),供資料科學家使用先進的算法,來量化、評估和改進機器學習不確定性,以提高人工智能系統(tǒng)的安全性。
深度學習人工智能系統(tǒng),可能在錯誤的情況,做出過于自信的預測,過去已經有自動駕駛汽車,因為人工智能系統(tǒng)的失誤,而導致人員傷亡,不只是自動駕駛車,IBM提到,應用在醫(yī)療上的人工智能系統(tǒng),也可能因為模型以低確定性做出預測,而造成病患死亡。
常見的可解釋技術,能夠描述人工智能模型的工作原理,讓像是預測房價系統(tǒng)模型用戶,知道預測誤差范圍,以估計收益或是損失,而產品經理也可能利用人工智能模型,來預測不同功能的平均表現,以及對于KPI的影響。IBM提到,不確定性量化則能進一步披露模型的局限性和潛在的故障點,因此可以改善更多人與人工智能協作的需求。
不確定性可以讓人們知道,是否該信任模型的預測結果,像是護理師可以使用人工智能系統(tǒng)來幫助診斷皮膚病,當人工智能可信度很高,則醫(yī)護人員便能接受人工智能的決定,反之,當人工智能建議不被采信,就可將病患轉診至皮膚科醫(yī)生。IBM提到,不確定性是人工智能系統(tǒng)和人類用戶間的溝通形式,能夠實現最佳的準確性、強健性和公平性。
UQ360是一個開源工具包,提供不確定性量化的評估、測量、改進和溝通。不確定性量化的方法取決于許多因素,包括基礎模型、機器學習任務的類型、資料的特征和用戶的目標等,IBM提到,部分時候資料科學家所選用的不確定性量化方法,可能無法產生高品質的不確定性評估,因而誤導用戶,所以在部署人工智能系統(tǒng)之前,必需要評估并且改進不確定性量化品質。
而UQ360可以協助資料科學家解決這個問題,借由使用UQ360工具包,就可以評估、測量、改進和溝通不確定性量化。官方提到,這是目前第一個不確定性量化開源工具包,提供了一套算法來量化模型不確定性,并且助用戶評估和改進不確定性量化,以簡化模型開發(fā)過程。
另外,UQ360也能協助團隊高性能的進行溝通,因為UQ360將不確定性量化的溝通方法,集成到了人工智能生命周期中,并且對每種不確定性量劃算法提供UQ360 Python組件,開發(fā)者可以按照指引,選擇適當的溝通形式,進行簡明描述或是詳細的可視化呈現。
IBM表示,UQ360不僅是Python函數庫工具包,而是能夠作為人工智能不確定性和局限性的溝通透明平臺。IBM創(chuàng)建了交互式體驗,來供用戶了解生成高品質不確定性量化的方法,同時也提供許多教學內容,展示在人工智能周期中使用不確定性量化的方法。
UQ360采用通用接口設計,適用于不同的不確定性量化功能,期望可以推動社群的負責任人工智能應用加速創(chuàng)新。