Google本周宣布新的機器人AI模型PaLM-SayCan,讓Alphabet開發(fā)的事務幫手型(helper)機器人更能理解用戶的指令,并且更聰明執(zhí)行任務。
Alphabet X于2019年11月公布通用型學習機器人項目Everyday Robot Project,旨在開發(fā)日常任務用機器人,可執(zhí)行倒垃圾、擦桌子、整理家具、長遠目標是能幫助獨居長者自理家務等高端任務。去年Alphabet也展示Every Robot已在公司內(nèi)員工餐廳擦桌子、或在辦公室整理會議室。
圖片來源/Google
Google指出,過去幾年公司雖然在應用機器學習技術于機器人有一些進展,但到目前為止,這類機器人仍僅能執(zhí)行硬編寫的短指令,像是“拿起一顆蘋果”,在簡單明白、且反饋快速的任務上效果比較好。但它們不太能首席執(zhí)行官串指令,或理解抽象目標,像是“我剛運動完,你能幫我準備健康的點心嗎?”
Google同時說明,先前訓練語言模型的方法,由于語言模型并不和實體世界互動,也未觀察其反應造成的結(jié)果,因此現(xiàn)行模型如GPT-3可能會出現(xiàn)令人啼笑皆非的回應,像是如果用戶表示“我飲料灑出來了,你能幫忙嗎?”他會給出“你可以試試吸塵器”等不安全、不實用的“建議”,而FLAN模型的反應則是“對不起,我不是有意灑出來的?!?/p>
而Google則發(fā)展出名為PaLM-SayCan的模型。其名稱來自它利用語言模型的知識(理解用戶說話的動機,即Say)來決定和評估有用的行動。這個做法也利用“可供性”(affordance)功能做選擇在其周邊環(huán)境條件下可行的做法(Can)。
SayCan和機器人的關系是,機器人提供PaLM-SayCan語言模型的手和眼睛,而語言模型則提供任務的高端語義知識。系統(tǒng)執(zhí)行過程好比是由語言模型推動的人、機對話過程。一開始用戶發(fā)出指令,語言模型將之轉(zhuǎn)化成一系列機器人執(zhí)行的步驟。這個步驟串行是由機器人技能過濾,并依據(jù)當時環(huán)境條件決定最高可行性的計劃。此外,本模型也加入任務對應性(即技能語言描述),及和真實世界的對應性(即技能可行性)兩種幾率來決定完成指令的成功率。
因此在用戶說出打翻飲料時,PaLM-SayCan可以做出幾率計算后,在尋找吸塵器、找海綿、找垃圾筒、撿起蘋果等行為選項中,最后選擇拿來一塊海綿。
圖片來源/Google
Google也公開了機器人模擬設置的技術資源和文件,供有興趣的團隊測試這個PaLM-SayCan模型。