Till innehåll på sidan
Till KTH:s startsida Till KTH:s startsida

Synergier mellan policyinlärning och sampling-baserad planering

Tid: Ti 2024-01-30 kl 15.00

Plats: F3 (Flodis), Lindstedtsvägen 26 & 28

Videolänk: https://kth-se.zoom.us/j/63888939859

Språk: Engelska

Ämnesområde: Datalogi

Respondent: Robert Gieselmann , Robotik, perception och lärande, RPL

Opponent: Associate Professor Edward Johns, Imperial College London, London, England, UK

Handledare: Associate Professor Florian T. Pokorny, Robotik, perception och lärande, RPL

Exportera till kalender

QC 20240108

Abstract

De senaste framstegen inom artificiell intelligens och maskininlärning har haft en betydande inverkan på robotikområdet och lett till det tvärvetenskapliga studerandet av robotinlärning. Dessa utvecklingar har potentialen att revolutionera automatiseringen inom olika industrier genom att minska beroendet av mänskliga arbetare. Dock är helt autonoma, inlärningsbaserade robotsystem fortfarande huvudsakligen begränsade till kontrollerade miljöer. Idealt sett letar vi efter metoder som möjliggör autonom förvärvning av robotfärdigheter för situationer med långa tidshorisonter och potentiellt komplexa sensorobservationer. Klassiska sampling-baserade planeringsalgoritmer som används i robotrörelseplanering beräknar genomförbara vägar mellan robottillstånd över långa tidshorisonter och även i geometriskt komplexa miljöer. I detta arbete undersöker vi möjligheten att kombinera inlärningsbaserade tillvägagångssätt med dessa klassiska tillvägagångssätt för att lösa utmanande problem inom robotmanipulation, t.ex. hantering av formbara objekt. Kärnidén är att utnyttja det bästa av båda världarna och uppnå långsiktig kontroll genom planering, samtidigt som man använder inlärning för att erhålla användbara miljömodeller från potentiellt högdimensionella och komplexa observationsdata. De presenterade ramverken förlitar sig på senaste maskininlärningstekniker såsom kontrastiv representationsinlärning, generativ modellering och förstärkningsinlärning. Slutligen skisserar vi potentialerna, utmaningarna och begränsningarna med denna typ av tillvägagångssätt och belyser framtida riktningar.

urn.kb.se/resolve?urn=urn:nbn:se:kth:diva-341911