Pursuit Domain

Stone, 1997, https://www.cs.cmu.edu/afs/cs/usr/pstone/public/papers/97MAS-survey/node8.html

Grundidee

Bereits 1986 wurde eine Aufgabe für simulierte Agenten vorgeschlagen, die dem Wolf und Schafe Spiel ähnlich ist: Auf einem schachbrettartigen Feld befinden sich vier Verfolger und ein Opfer (darum auch “predator/prey domain”). Alle können sich frei in die vier Haupthimmelsrichtungen bewegen. Die Aufgabe der Verfolger ist es, das Opfer so einzukreisen, dass es sich nicht mehr bewegen kann.

Spielregeln

Ein Vergleich zwischen der Pursuit Domain und Wolf und Schafe

  Pursuit Domain
(typische Werte bzw. Varianten)
Wolf und Schafe
Vier Verfolger versuchen ein Opfer so einzukreisen, dass es sich nicht mehr bewegen kann. Die vier Schafe starten am einen Brettrand, der Wolf am anderen. Der Wolf versucht die Kette der Schafe zu durchbrechen. Die Schafe versuchen den Wolf bewegungsunfähig zu machen.
Feldgrösse  30 mal 30 8 mal 8 (bzw. 4 mal 8, da nur die schwarzen Felder eines Schachbretts genutzt werden)
Feldgrenzen keine Grenzen, d.h. das Feld wird als Torus geschlossen Unüberschreitbare Grenzen, die auch dazu genutzt werden können, den Wolf zu blockieren.
Feldform Rechteck oder Sechseck Rechteck
Erlaubte
Bewegungen
  • in alle vier Hauptrichtungen (orthogonal)
  • alle acht Richtungen (diagonal)
nur diagonal, Schafe nur von ihrer Startseite weg
Mehrere Agenten an einem Ort
  • nicht erlaubt
  • nur für Verfolger erlaubt
  • für alle möglich
nicht erlaubt
Zugfolge
  • alle Agenten in jedem Takt
  • Opfer nur in 9 von 10 Takten
Abwechslungsweise ein Schaf, der Wolf, ein Schaf …
Gefangennahme
  • Einkreisen
  • in eine bestimmte Ecke treiben
  • am selben Ort sein
Einkreisen
Opfer gewinnt
  • nie
  • Durchbruch auf eine bestimmte Seite
Durchbruch
Weitere Agenten
  • keine
  • ein zusätzlicher, störender Agent, der zurückgehalten werden muss
keine weiteren Agenten
Bewegung des
Opfers
  • zufällig
  • geradlinig
  • weg vom nächsten Verfolger
frei, es existiert eine optimale Durchbruchstrategie
Lernverhalten des Opfers
  • lernt nicht dazu
  • verbessert Strategie ebenfalls
bei menschlichen Spielern ist zu hoffen, dass sie dazulernen
Gegenseitige Sichtbarkeit
  • alle sichtbar
  • beschränktes Sichtfeld (z.B. 7×7) nur nächste Figur sichtbar
alle sichtbar
Kommunikation zwischen Verfolgern
  • möglich
  • nicht möglich
möglich
Kooperation
zwischen den
Verfolgern
  • bewusst dasselbe Ziel
  • unbewusst dasselbe Ziel
  • unterschiedliche, kompatible Ziele
  • inkompatible Ziele
bewusst dasselbe Ziel
Homogenität der Verfolger
  • identische Verfolger, die auch dasselbe lernen
  •  identische Verfolger, die je eine eigene Lerngeschichte haben
  • ganz unterschiedliche Verfolger
identische Verfolger (Ziel und mögliche Elementaraktionen) mit allenfalls unterschiedlichem Vorwissen und unterschiedlicher Lerngeschichte
Charakteristik der Verfolgergruppe
  • schwarmartig: viele einfache Agenten
  • kooperativ: wenige, komplexe Agenten;
  • kollaborativ: Kommunikation zusätzlich
kollaborativ

Strategie

Es gibt unterdessen eine umfangreiche Literatur, die allen möglichen Detailfragen nachgeht. Es ist nicht möglich, die Resultate hier zusammenzufassen, z.B.:

Gina Grossi (2017) Evolved Communication Strategies and Emergent Behaviour of Multi-Agents in Pursuit Domains