NVIDIA heeft een nieuw deep learning-gebaseerd systeem ontwikkeld dat robots in staat stelt taken te leren door menselijke werknemers te observeren. Dit maakt het niet alleen eenvoudiger om robots nieuwe taken aan te leren, maar versnelt ook dit leerproces. Tijdens een demonstratie van het systeem wist een robot al na slechts één demonstratie een taak succesvol uit te voeren.
Traditionele industriële robots worden geprogrammeerd voor specifieke taken, wat een tijdrovend proces is. Industriële robots zijn in staat taken zeer efficiënt en snel uit te voeren, maar bieden weinig flexibiliteit en kunnen niet eenvoudig voor een andere taak worden ingezet. Ook moeten industriële robots achter een veiligheidshek worden geplaatst om ongelukken met menselijke werknemers te voorkomen.
Daarnaast zijn er collaboratieve robots of cobots beschikbaar, die dankzij sensoren in staat zijn de aanwezigheid van mensen te detecteren en hun gedrag hierop aan te passen. Deze robots hoeven hierdoor niet achter een veiligheidshek te worden geplaatst en kunnen nauwer samenwerken met menselijke werknemers. In tegenstelling tot traditionele robots maken collaboratieve robots vaak gebruik van kunstmatige intelligentie en neurale netwerken om bepaalde taken aan te leren. Taken kunnen hierdoor sneller worden aangeleerd, waardoor robots flexibeler kunnen worden ingezet.
Het trainen van collaboratieve robots vereist echter veel trainingsdata, die nauwkeurig moet worden gelabeld. Het creëren van deze data kost veel tijd en vormt volgens NVIDIA dan ook een belangrijke bottleneck in dergelijke systemen. “Om robots in de praktijk zinvolle taken te laten uitvoeren, moet het eenvoudig zijn de taak naar de robot te communiceren; dit is inclusief het gewenste resultaat en hints die helpen die resultaat te behalen”, melden onderzoekers van NVIDIA in een onderzoekspapers. “Met demonstraties kan een gebruiker een taak naar de robot communiceren en aanwijzigingen geven over de wijze waarop de taak het best uitgevoerd kan worden.”
De onderzoekers hebben dit probleem aangepakt door gebruik te maken van synthetische data om neurale netwerken te trainingen. Deze data kan automatisch worden gegenereerd, wat het mogelijk maakt in korte tijd en met minimale investeringen een nagenoeg oneindige hoeveelheid gelabelde trainingsdata te produceren. Deze synthetische data hebben de onderzoekers ingezet om met behulp van NVIDIA TITAN X grafische processors (GPU’s) een reeks neurale netwerken te trainen om taken uit te voeren die gerelateerde zijn aan het interpreteren van beelden, het creëren van programma’s die de stappen beschrijven die nodig zijn voor specifieke taken en het uitvoeren van deze programma’s. Deze training stelt robots in staat op basis van een gedemonstreerde taak zelf vast te stellen hoe deze taak moet worden uitgevoerd. Zo wist een robot tijdens een praktijktest van NVIDIA wist een taak na slechts één demonstratie succesvol uit te voeren.
Daarnaast hebben de onderzoekers een ‘beeldgerichte domein randomiseringsaanpak’ gehanteerd. Hierbij wordt zeer gevarieerde synthetische data gegenereerd die wordt ingezet om een robot te trainen. Het perceptienetwerk van de robot wordt vervolgens om de tuin geleid zodat deze data uit de praktijk interpreteert als simpelweg een nieuwe variatie op zijn trainingsdata.
Of een robot erin slaagt een gedemonstreerde taak succesvol uit te voeren is in belangrijke mate afhankelijk van de waarnemingen van de robots en de wijze waarop de robot deze waarnemingen interpreteert. Indien hier fouten in ontstaan, kan dit de wijze waarop de taak wordt uitgevoerd beïnvloeden. Om het voor gebruikers eenvoudiger te maken dit soort fouten op te sporen creëert de robot met behulp van de technologie van NVIDIA een voor mensen leesbare beschrijving van de stappen die het wil doorlopen om de taak uit te voeren. Deze omschrijving stelt gebruikers in staat fouten in de interpretatie van de robot snel op te sporen en te corrigeren, nog voordat de robot de taak in de praktijk probeert uit te voeren.
In de onderstaande video wordt de test met de robot getoond. Hierbij stapelt een mens een aantal gekleurde blokken op elkaar, waarna de robot deze taak zelf uitvoert.
Het team van NVIDIA wil de komende tijd het gebruik van synthetische trainingsdata om robots te trainen verder onderzoeken om de mogelijkheden van hun nieuwe trainingsmethode uit te breiden. Meer informatie over het onderzoek is te vinden in een onderzoekerspaper die de onderzoekers hebben vrijgegeven.
Auteur: Wouter Hoeffnagel
Bron: NVIDIA
Bron: Onderzoekspaper ‘Synthetically Trained Neural Networks for Learning Human-Readable Plans from Real-World Demonstrations’