韓國電子和電信研究所(ETRI)的研究人員最近開發(fā)了一個(gè)基于深度學(xué)習(xí)的模型,該模型可以幫助機(jī)器人創(chuàng)造自發(fā)的社會行為,如擁抱或握手。手。他們的模型在arXiv上一篇預(yù)先發(fā)表的論文中提出,我們可以通過檢查人與人之間的交互來動態(tài)地學(xué)習(xí)新的社會行為。
“深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺和自然語言理解等領(lǐng)域產(chǎn)生了有趣的結(jié)果,”領(lǐng)導(dǎo)這項(xiàng)研究的研究人員之一Woo-RiKo告訴TechXplore?!拔覀円呀?jīng)開始將深度學(xué)習(xí)應(yīng)用于社交機(jī)器人,尤其是讓機(jī)器人從人類的互動中學(xué)習(xí)社交行為。
Ko和他的同事開發(fā)的基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的技術(shù)將谷歌研究人員在2014年推出的Seq2Seq(序列對序列)模型與對抗網(wǎng)絡(luò)(GAN)的生成相結(jié)合。新架構(gòu)在AIR-Act2Act數(shù)據(jù)庫上進(jìn)行訓(xùn)練,該數(shù)據(jù)庫包含10種不同情況下的5000次人機(jī)交互。
“建議的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由編碼器、解碼器和鑒別器組成,”Ko解釋道?!熬幋a器解釋用戶的當(dāng)前行為,解碼器根據(jù)用戶和機(jī)器人的當(dāng)前行為創(chuàng)建下一個(gè)機(jī)器人行為,鑒別器防止解碼器在導(dǎo)致持續(xù)行為時(shí)輸出錯(cuò)誤的手勢序列?!?/p>
利用AIR-Act2Act數(shù)據(jù)庫中記錄的5000次交互,提取了超過11萬個(gè)訓(xùn)練樣本(即短視頻),其中人類在與他人交互時(shí)執(zhí)行特定的非語言社交行為。研究人員專門訓(xùn)練他們的模型,為機(jī)器人創(chuàng)造五種非語言手勢,即鞠躬、眼神、握手、擁抱和捂臉。
Ko和他的同事在一系列模擬中評估了他們的非語言社會行為模型,特別是將其應(yīng)用于模擬版Pepper,這是一種廣泛應(yīng)用于研究領(lǐng)域的人形機(jī)器人。他們的初步發(fā)現(xiàn)是有希望的,因?yàn)樗麄兊哪P蛯⒃谌祟惢舆^程中的正確時(shí)間執(zhí)行五種行為。
“我們已經(jīng)證明,不同類型的社會行為可以通過深度學(xué)習(xí)方法教給機(jī)器人,”Ko說。“我們的模型可以產(chǎn)生更自然的行為,而不是根據(jù)現(xiàn)有的規(guī)則以某種方式重復(fù)預(yù)定的行為。當(dāng)機(jī)器人創(chuàng)造這些社交行為時(shí),它會讓用戶意識到他們的行為在情感上被理解和關(guān)心?!?/p>
研究人員創(chuàng)建的新模型可以幫助社交機(jī)器人變得更加靈活,對社交更加敏感,這可能會提高它們與人類用戶互動的整體質(zhì)量和過程。未來可以在家庭服務(wù)機(jī)器人、引導(dǎo)機(jī)器人、送貨機(jī)器人、教育機(jī)器人、臨場機(jī)器人等各種機(jī)器人系統(tǒng)中進(jìn)行應(yīng)用和測試?!拔覀儸F(xiàn)在計(jì)劃進(jìn)行額外的實(shí)驗(yàn),測試機(jī)器人在現(xiàn)實(shí)世界中面對人類時(shí)表現(xiàn)出適當(dāng)社交行為的能力;提議的行為發(fā)生器的強(qiáng)度將在數(shù)據(jù)上進(jìn)行測試。”此外,通過收集和學(xué)習(xí)更多的交互數(shù)據(jù),我們計(jì)劃擴(kuò)大社會行為和復(fù)雜行動的范圍,我們就是展出的機(jī)器人。"
特別聲明:文章僅代表作者個(gè)人觀點(diǎn),不代表麗泰的觀點(diǎn)和立場。如果侵犯到您的權(quán)益,版權(quán)或其他問題請及時(shí)聯(lián)系我們,我們會第一時(shí)間處理。