Alphabet, het moederbedrijf van Google, experimenteert met robots die in staat zijn zelfstandig taken aan te leren zonder hiervoor geprogrammeerd te hoeven zijn. Dit is volgens het bedrijf nodig om tot robots te komen die mensen in hun dagelijks leven effectief kunnen ondersteunen.
Het project heet Everyday Robot Project en is aangekondigd door Hans Peter Brondmo, General Manager van het project. “De hedendaagse wereld van robots lijkt veel op de wereld van computers van 50 jaar geleden. Het is een veelbesproken onderwerp en er is veel optimisme over hoe robots kunnen helpen in het dagelijks leven van mensen. Deze toekomst is echter nog ver weg. De meeste robots bevinden zich in het stadium waar mainframe computers zich in de jaren ’60 en ’70 bevonden. Het zijn dure gespecialiseerde machines die worden beheerd door experts en gespecialiseerde taken uitvoeren is speciaal hiervoor ontworpen omgevingen”, schrijft Brondmo in een blogpost.
Hij wijst erop dat mensen van nature zicht, begrip, navigatie en handelingen combineren om doelen te realiseren. Hedendaagse robots kunnen dit niet en moeten nauwkeurig geprogrammeerd worden. Het is hierdoor voor robots een grote uitdaging taken die voor mensen eenvoudig zijn uit te voeren in een zeer dynamische en veranderlijke omgeving.
“Om robots nuttig te maken in alledaagse omgevingen moeten we af van het nauwkeurig coderen van robot om specifieke en gestructureerde taken uit te voeren op exact de juiste wijze en exact het juiste tijdstip”, aldus Brondmo. Machines moet zelf leren zinnige taken uit te voeren, stelt hij.
Ondanks dat het Everyday Robot Project nu officieel is aangekondigd, is het team achter de schermen al enkele jaren actief. Verschillende experimenten van het team werden wel naar buiten gebracht. Zo toonde het team eerder aan hoe robots sneller kunnen leren indien zij in de cloud worden gesimuleerd, hoe robots kunnen leren van demonstraties door mensen en hoe robots ervaringen kunnen delen om van elkaar te leren.
De kennis die het team hiermee heeft opgedaan wordt nu ook in de praktijk ingezet. Het team leert robots afval te sorteren, waarbij zij bekers, flesjes, verpakkingsmateriaal en andere materialen verdelen over de vuilstort, recycling of composthoop. Hierbij wordt gebruik gemaakt van verschillende machine learning technieken, waaronder simulatie, reinforcement trainen en collaborative training.
De robots worden getraind in de cloud; iedere nacht trainen tienduizenden virtuele robots in een virtueel kantoor om hun sorteervaardigheden verder te verfijnen. Deze cloud-gebaseerde training wordt gecombineerd met training in de praktijk, waarbij fysieke robots worden ingezet. De data die hierbij wordt opgedaan wordt teruggekoppeld naar de cloud en de gevirtualiseerde robots, die deze input meenemen in hun virtuele training. De robots leren hierdoor van elkaar.
De resultaten zijn volgens Brondmo veelbelovend. “In de afgelopen maanden hebben onze robots duizenden stukken afval gesorteerd en het vervuilingsniveau (red: de hoeveelheid verkeerd gesorteerd afval) teruggedrongen van 20% – wat het is als mensen objecten bij het afval gooien – naar minder dan 5%”, schrijft hij.
“De resultaten zijn vanwege verschillende redenen veelbelovende. Allereerst tonen zij dat we in staat zijn een robotsysteem te creëren dat alle functionaliteiten van de robot integreert om iets daadwerkelijk nuttigs te doen: het terugdringen van het vervuilingsniveau tot minder dan 5% zorgt dat afval succesvol wordt weggehouden van de vuilstort. Daarnaast bewijst het dat robots in staat zijn in de echte wereld nieuwe taken te leren door te oefenen, in plaats van dat technici ‘code overhandigen’ voor iedere nieuwe taak, uitzondering of verbetering.”
De komende tijd wil het team proberen de kennis die de robot heeft opgedaan bij het uitvoeren van deze taak toe te passen voor het aanleren van een andere taak, zonder de robot te herbouwen of veel nieuwe code te schrijven. “Dit kan onmogelijk blijven, maar we gaan het proberen”, aldus Brondmo.
De volledige blogpost is hier te vinden.
Auteur: Wouter Hoeffnagel