next up previous
Next: Einschränken des Schießens auf Up: Verbesserungen Previous: Einschränkung des Aktionsraumes

Einschränkung des Zustandsraumes

Ebenfalls durch den Greifer war es möglich, auch den Zustandsraum einzugrenzen. So spielte es etwa keine Rolle, ob der Ball links, mittig oder rechts war, sobald er sich in der Schaufel befand. Auch die Unterscheidung fern-mitte-nah reduzierten wir auf fern-nah, da der Roboter sich bei fern und mitte sowieso ziemlich gleich verhielt. Damit ergab sich:

Die Einträge der Qa-Matrix konnten so auf 308 reduziert werden ([Qa] = 308). Damit war es dem Roboter bereits möglich, seine Aufgabe nahezu perfekt zu lernen. Lediglich durch die manuelle Eingabe des Rewards nach jeder Aktionswahl war das Verfahren noch zeitaufwendig.


next up previous
Next: Einschränken des Schießens auf Up: Verbesserungen Previous: Einschränkung des Aktionsraumes

root
Sun Jul 4 16:38:27 MEST 1999