Seminar F, SS02: Maschinelles Lernen in der Robotik

Institut für Grundlagen der Informationsverarbeitung (508)


Treffen/Vorträge




Gruppeneinteilung



Newsgroups

E-Mails



Inhalt des Seminars

Einführung in die high-level control von mobilen Robotern. Anwendungsbereiche und Verfahren des Maschinellen Lernens in der Robotik am Beispiel der mid-size league Roboter im RoboCup (http://www.robocup.org/). Implementierung und praktische Evaluierung von Lernverfahren am mini-Roboter khepera (http://www.k-team.com/robots/khepera/), sowie im Roboter-Simulator Webot (www.cyberbotics.com) für ein Modell des gegenwärtig vom RoboCup Team der TU Graz (http://www.igi.tugraz.at/robotik/robocup/) entwickelten Roboter für die mid-size league.

Die Vorträge und Versuchsberichte der Studierenden werden ergänzt durch einführende Vorträge von den LV-Leitern, Prof. Dr. Axel Pinz sowie vermutlich Gastvorträge von Entwicklern bei auswärtigen RoboCup Teams.
 

Anmerkungen:

1. Es wird vorausgesetzt, daß die Seminarteilnehmer gleichzeitig an der LV Maschinelles Lernen B teilnehmen oder anderweitige Erfahrungen mit Reinforcement Learning (http://reinforcementlearning.ai-depot.com/Main.html) haben.

2. Einige der Themen dieses Seminars können als Grundlage für 6 std. Seminar/Projekte und/oder Diplomarbeiten verwendet werden. Dies wäre besonders geeignet für Studierende, die im Anschluß an dieses Seminar bei der Entwicklungsarbeit für die high-level control der RoboCup Roboter der TU Graz mitmachen möchten. Interessenten sollten baldmöglichst Dr. Natschläger (tnatschl@igi.tu-graz.ac.at) kontaktieren.

3. Die meisten in diesem Seminar besprochenen Anwendungen von Maschinellem Lernen in der Robotik involvieren gleichzeitig Methoden des Maschinellen Sehens (Objekt-Erkennen, Tracking, Messen aus Bildern). Studierende mit Vorkenntnissen aus diesem Bereich sind besonders willkommen in diesem Seminar.

4. Es ist geplant, daß dieses Seminar im WS 2002/03 fortgesetzt wird mit der Untersuchung und Implementierung von Lernverfahren für mulit-agent-systems (zur Entwicklung von adaptiven Team-Strategien für das aus 4 Robotern bestehende Roboterfußball Team der TU Graz).
 

Konkrete Themen des Seminars

Wir konzentrieren uns auf zwei fundamentale Behaviours, die offensichtlich für die mid-size league von entscheidender Wichtigkeit sind und bei denen Verfahren des ML helfen können.
 

Gruppe A:

Ziel:
Evaluierung und Implementierung verschiedener Verfahren, die es dem Roboter erlauben, mit möglichst hoher Geschwindigkeit den Ball zu einem Ziel zu führen (mit Umgehung von Hindernissen).

Konkreter:
Da Flanken, Doppelpaß etc. in der mid-size league meist geringe Erfolgschancen haben, ist die Fähigkeit wesentlich, daß der Roboter den Ball selbst zum Tor hinführen kann unter Vermeidung der Auslinie und Umfahrung von Hindernissen (Gegenspielern, werden zunächst als statisch angenommen).

Praktische Implementationen:


Techniken:
a) Hoffentlich weniger schwierige Techniken des Maschinellen Sehens: Erkennen des Balls vor dem Roboter, Schätzen von dessen Position (und Geschwindigkeit ?) relativ zum Roboter
b) Regelungstechnik
c) Neuronale Netze (neurocontrol)
d) reinforcement learning
e) cleveres Einbringen von Vorwissen (weil Lernen nur am wirklichen Roboter durch-geführt werden kann, ist die Anzahl der möglichen Trainingsbeispiele relativ klein und sollte durch alles vorhandene Vorwissen ergänzt werden.
 

Teilnehmer Gruppe A:
M. Antenreiter, C. Arth, M. Gross, S. Neumann, P. Teufl
 
 

Gruppe B:

Ziel:
Ball abfangen (interception) und unter Kontrolle bringen.

Konkreter:
Wir betrachten die Situation, in der der Roboter die Gelegenheit hat, ohne Zweikampf mit einem Gegenspieler einen rollenden Ball abzufangen. In der Regel ist es gleichzeitig wünschenswert, daß der Roboter nicht nur den Ball berührt, sondern ihn so unter Kontrolle bekommt, daß er damit zu einem Ziel fahren kann (mit dem Behaviour, das von Gruppe A erarbeitet wird). Dazu gehört Abbremsen des Balles durch Eigenbewegung des Roboters ("rückwärts fahren"), und sobald Abschußvorrichtung montiert ist, auch gleichzeitige Rückwärtsbewegung der Abschußvorrichtung.

Praktische Implementationen:


Techniken:
a) maschinelles Sehen (besonders messen aus Bildern, tracking)
b) Kalman Filter und andere Methoden zur Vorhersage von Zeitreihen
c) neuronale Netze (insbesondere welche, die Zeitreihen von Inputs verarbeiten können, aber auch zur allgemeinen Korrektur systematischer  Fehler von expliziten Modellen)
d) Reinforcement Lernen (zur Bewegungsplanung für das Abfangen und Abstoppen des Balles)
e) Regelungstechnik
f) Einbringen von Vorwissen (Ball-Mechanik etc.)

Anmerkung:
Da wir an dieser Aufgabe auch im Simulator arbeiten können, kann man hier auch Methoden des ML ausprobieren, die größere Mengen von Trainingsbeispielen erfordern. Andererseits sollten möglichst frühzeitig Divergenzen zwischen Webot Simulator vom Keksi und Keksi möglichst bald systematisch untersucht werden um sicherzustellen, daß am Simulator erlernte Verfahren auch am Keksi einsetzbar sind. Divergenzen zwischen khepera und Simulation vom khepera können gleich untersucht werden.
 

Teilnehmer Gruppe B:
W. Draxl, H. Grabner, A. Haller, M. Kobencic, A. Mühlenfeld, G. Neumann, M. Pfeiffer



"Wie bekomme ich mein Zeugniss?"

Anmeldung

Um ein Zeugnis zu bekommen, melden Sie sich bitte via TUG-Online für die Teilnahme zu dieser LV (508.106) an.

Lehrveranstalungsleiter

Diese Lehrveranstaltung wird vom Institut für Grundlagen der Informationsverarbeitung, Inffeldgasse 16b, 1. Stock, A-8010 Graz abgehalten.

Sekretariat



Literatur

Maschinelles Lernen in der mid-size league des RoboCup:
 

Maschinelles Lernen im RoboCup allgemein (mit Anwendungen überwiegend in der simulation league):
 


Maschinelles Lernen in der Robotik allgemein:
 

Minoru Asada (http://www.er.ams.eng.osaka-u.ac.jp/index-eg.html)

Benjamin Kuipers (http://www.cs.utexas.edu/users/qr/)

Maja Mataric (http://www-robotics.usc.edu/~maja/)

Martin Riedmüller (http://i11www.ira.uka.de/~riedml/)

High-level robot control:
 



Für das Seminar interessante Links



Neuigkeiten


12.04.2002 Es wurden die e-mail Adressen aller Teilnehmer und eine Gruppeneinteilung hinzugefügt.
21.02.2002 Diese Homepage wird ins Leben gerufen. Ich hoffe Sie nutzen die Möglichkeiten die wir Ihnen hier bieten. Falls Sie Anregungen oder Beschwerden zur Homepage haben senden Sie uns eine e-mail.