Se vuoi avere una squadra di calcio robotica, devi prima simularla. Il calcio è una grande sfida per la comunità della robotica. Questo gioco richiede decisioni a diversi livelli di astrazione: dal controllo veloce del corpo umano al punteggio di squadra. Un recente articolo di DeepMind propone un ambiente calcistico simulato che si concentra sul problema della coordinazione dei movimenti. Panoramica dell'ambiente simulato del calcio umanoide. Credito immagine: Siqi Liu et al., ArXiv: 2105.12196 Contiene squadre di calciatori umanoidi completamente articolati che si muovono in un ambiente fisico simulato realisticamente. Il quadro formativo consiste in una procedura in tre fasi durante la quale l'apprendimento progredisce dall'imitazione per il movimento di basso livello all'apprendimento di rinforzo multi-agente per il gioco completo. È dimostrato in questo studio che gli agenti artificiali possono imparare a coordinare movimenti complessi al fine di interagire con gli oggetti e raggiungere obiettivi a lungo orizzonte in collaborazione con gli altri. I principi alla base del modello sono applicabili in altri domini, inclusi altri sport di squadra o scenari di lavoro collaborativo. Il comportamento intelligente nel mondo fisico mostra una struttura su più scale spaziali e temporali. Sebbene i movimenti siano alla fine eseguiti a livello di tensioni muscolari istantanee o momenti articolari, devono essere selezionati per servire obiettivi definiti su scale temporali molto più lunghe e in termini di relazioni che si estendono ben oltre il corpo stesso, coinvolgendo in ultima analisi il coordinamento con altri agenti. Recenti ricerche sull'intelligenza artificiale hanno mostrato la promessa di approcci basati sull'apprendimento ai rispettivi problemi di movimento complesso, pianificazione a lungo termine e coordinamento multi-agente. Tuttavia, la ricerca finalizzata alla loro integrazione è limitata. Studiamo questo problema addestrando squadre di avatar umanoidi simulati fisicamente per giocare a calcio in un ambiente virtuale realistico. Sviluppiamo un metodo che combina l'apprendimento dell'imitazione, l'apprendimento per rinforzo singolo e multi-agente e la formazione basata sulla popolazione e fa uso di rappresentazioni trasferibili del comportamento per il processo decisionale a diversi livelli di astrazione. In una sequenza di fasi, i giocatori imparano prima a controllare un corpo completamente articolato per eseguire movimenti realistici, simili a quelli umani, come correre e voltarsi; acquisiscono quindi abilità calcistiche di medio livello come dribbling e tiro; infine, sviluppano la consapevolezza degli altri e giocano come una squadra, colmando il divario tra il controllo motorio di basso livello su una scala temporale di millisecondi e un comportamento coordinato diretto all'obiettivo come una squadra sulla scala temporale di decine di secondi. Indaghiamo l'emergere di comportamenti a diversi livelli di astrazione, nonché le rappresentazioni che sono alla base di questi comportamenti utilizzando diverse tecniche di analisi, comprese le statistiche dall'analisi sportiva del mondo reale. Il nostro lavoro costituisce una dimostrazione completa del processo decisionale integrato su più scale in un contesto multi-agente fisicamente incarnato. Guarda il video del progetto su https://youtu.be/KHMwq9pv7mg. Documento di ricerca: Liu, S., “From Motor Control to Team Play in Simulated Humanoid Football”, 2021. Link: https://arxiv.org/abs/2105.12196

57 Views
(Visited 7 times, 1 visits today)

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *