next up previous
Next: Einschränkung des Zustandsraumes Up: Verbesserungen Previous: Verwendung eines Greifers

Einschränkung des Aktionsraumes

Durch den Greifer war es für den Roboter theoretisch möglich, auch mit wesentlich weniger Aktionen seine Aufgabe zu meistern. Wir entschieden uns, nur mehr die drei Aktionen in Vorwärtsrichtung zuzulassen und eine eigene Schußaktion (schnell vorwärts, kurze Pause, um den Ball ausrollen zu lassen) dazuzunehmen. Übrig blieben also noch:

Die Einträge in der Qa-Matrix verringerten sich auf 1020 ([Qa] = 1020). Damit ließen sich schon erste Lernerfolge erzielen, insgesamt konvergierte der Algorithmus aber immer noch viel zu langsam.


next up previous
Next: Einschränkung des Zustandsraumes Up: Verbesserungen Previous: Verwendung eines Greifers

root
Sun Jul 4 16:38:27 MEST 1999