iCub機器人通過算法逐漸學會做“面部表情”
發(fā)布時間 : 2020-04-22
隨著機器人進入各種環(huán)境融入我們的生活,開始與人類進行定期互動,它們需要盡可能有效地與用戶進行交流。因此,在過去十年左右的時間里,全世界的研究人員一直在開發(fā)基于機器學習的模型和其他可增強人機交互的技術。
改機器人與人類用戶交流方式的一種方法是訓練他們表達基本的情緒,例如悲傷、幸福、恐懼和憤怒。表達情緒的能力最終將使機器人能夠以與給定情況相符的方式更有效地傳達信息。
德國漢堡大學的研究人員最近開發(fā)了一種基于機器學習的方法,可以教機器人如何傳達以前被定義為七種普遍情感的東西,即憤怒、厭惡、恐懼、幸福、悲傷、驚奇和中立狀態(tài)。在預先發(fā)表在arXiv上的論文中,他們在名為iCub的人形機器人上應用并測試了其技術。
研究人員提出的新方法從以前開發(fā)的TAMER框架中汲取了靈感。TAMER是一種可用于訓練多層感知器MLP(一種人工神經網絡ANN)的算法。
在最近的研究中,TAMER框架適用于訓練基于機器學習的模型,以通過在iCub機器人中產生不同的面部表情來傳達不同的人類情感。iCub是由意大利理工學院(IIT)的研究團隊開發(fā)的開放源代碼機器人平臺,是歐盟項目RobotCub的一部分,該項目經常用于機器人研究中以評估機器學習算法。
研究人員在論文中寫道:“該機器人結合了卷積神經網絡(CNN)和自組織圖(SOM)來識別情感,然后學會使用MLP來表達情感?!?“我們的目標是教一個機器人對用戶的情緒感知做出適當反應,并學習如何表達不同的情緒?!?/p>
研究人員使用的CNN分析了iCub機器人捕獲的人類用戶面部表情的圖像。然后,將通過此分析產生的面部特征表示輸入到SOM,SOM揭示用戶如何表達特定情感的特定模式。
隨后,對這些模式進行建模并用于訓練MLP,以預測如何調整iCub的面部特征以最佳地模仿用戶的面部表情。然后,人類用戶根據機器人表達情感的準確性來獎勵機器人。
研究人員在論文中解釋說:“一旦iCub執(zhí)行并采取行動,用戶就會得到獎勵,從而為它提供目標價值?!?“這是通過要求用戶模仿機器人,并向其提供有關所執(zhí)行動作與預期動作有多少不同的信息來完成的?!?/p>
隨著時間的流逝,基于從人類用戶那里獲得的回報,研究人員設計的框架應該學會表達七種普遍情感中的每一種。到目前為止,已使用iCub機器人平臺在一系列初步實驗中對該技術進行了評估,取得了相當可觀的結果。
研究人員說:“盡管結果令人鼓舞,并且大大減少了培訓所需的時間,但我們的方法仍然需要每個用戶進行100多次交互才能學習有意義的表情。” “隨著培訓方法的改進和收集更多的培訓數(shù)據,這一數(shù)字有望減少?!?/p>