在訓練泉州機器人培訓的過(guò)程中,應采用正強化法,即相比于在它做錯時(shí)進(jìn)行懲罰,更應在它做對時(shí)進(jìn)行激勵。而對于機器人來(lái)說(shuō),這種激勵機制是以評分系統的形式呈現的,類(lèi)似玩游戲一樣,根據執行任務(wù)的情況獲得積分。
種方法能夠大大縮短訓練機器人執行任務(wù)的時(shí)間?!皺C器人希望能得到更高的分數,所以它們很快就可以完成相關(guān)任務(wù)。過(guò)去機器人需要一個(gè)月的練習才能達到100%的準確性,現在只用兩天就能做到?!?/section>不過(guò)他也指出,目前機器人執行的這些任務(wù)仍然是比較初級的,比如堆積木。但在未來(lái),機器人培訓有望通過(guò)正強化法完成更復雜和有意義的任務(wù)。