Kampis Elektroecke

Problem des Handlungsreisenden mit genetischen Algorithmus lösen

In diesem Artikel möchte ich die Implementierung eines genetischen Algorithmus für das Problem des Handlungsreisenden vorstellen. Das Ziel besteht darin, dass der Algorithmus den kürzesten Weg zwischen beliebig vielen Punkten (z. B. Städte) sucht, ohne das ein Punkt (mit Ausnahme des Startpunktes) mehr als einmal besucht wird.

Was ist ein “genetischen Algorithmus”?:

Unter einem evolutionären Algorithmus versteht man einen Algorithmus, der ähnlich funktioniert wie die natürliche Evolution eines Lebewesens. Diese Algorithmen werden für die Optimierung, bzw. für die Suche nach einer Lösung bei einem gegebenen Problem eingesetzt. In der Regel wird ein Merkmal des gegebenen Problems bestimmt, welches optimiert werden soll.

Der Algorithmus versucht dann durch zufällige Veränderungen einer Population das Merkmal zu optimieren. Dies geschieht durch Mutationen des Merkmals. Ganz wie in der Natur werden nur die besten Merkmale an die nächste Population weitergegeben. Ein genetischer Algorithmus besteht immer aus den selben Abläufen:

  1. Initialisierung – Es wird eine erste Population mit Merkmalen erzeugt (meistens mit zufälligen Werten)
  2. Evaluierung – Die einzelnen Individuen der Population werden hinsichtlich ihrer Güte untersucht. Diese Güte wird anschließend in eine Fitness umgerechnet
  3. Selektion – Aus der Population werden Individuen für eine Rekombination ausgewählt
  4. Rekombination – Zwei Eltern (ausgewählten Individuen) werden miteinander kombiniert und bilden Nachfahren
  5. Mutation – Zufällige Nachfahren mutieren
  6. Evaluierung – Es wird die Fitness der neuen Generation bestimmt
  7. Wiederholung ab Schritt 3

Der Ablauf wird so lange wiederholt bis ein bestimmtes Abbruchkriterium (z. B. eine Anzahl von Durchläufen) erreicht wurde. Das Ergebnis des Algorithmus ist dann die “stärkste” Generation, die das gegebene Problem am optimalsten löst.

Implementierung der Lösung

Gegeben ist die folgende Ausgangssituation:

Es sollen eine gegebene Menge Städte (hier 25 Stück) auf dem kürzesten Gesamtweg besucht werden. Am Ende der Tour soll in die Anfangsstadt zurückgekehrt werden. Der Startpunkt kann beliebig gewählt werden, aber es darf jede Stadt nur einmal besucht werden. Als Stadtkarte sei eine zufällige Anordnung von Punkten gegeben:

Die Städte werden durch eine City-Klasse beschrieben. Diese Klasse beinhaltet zwei Properties für die Position der Stadt als x- und y-Koordinaten, sowie eine Methode zum Berechnen der euklidischen Distanz zwischen zwei verschiedenen Städten.

Für den Algorithmus wird zudem ein Optimierungsmerkmal benötigt. Mit diesem Optimierungsmerkmal wird die Fitness ausgerechnet, die bestimmt wie gut der jeweilige Durchlauf ist.

In diesem Beispiel stellt die Gesamtdistanz der Städtetour das Optimierungsmerkmal dar. Der Algorithmus versucht während der Evolution eine hohe Fitness zu erreichen, wobei eine große Distanz eine schlechte Fitness und eine kleine Distanz eine große Fitness ergeben soll. Die Fitness berechnet sich in diesem Beispiel also aus der inversen Fitness.

Nun wird eine Startpopulation benötigt und für die Startpopulation werden Städte, bzw. deren Koordinaten benötigt. Diese Städte werden zufällig erzeugt und gespeichert.

Mit diesen Städten können nun die erste Population entwickelt werden. Hierzu wird eine zufällige Besuchsreihenfolge der Städte erstellt und in einer Liste gespeichert.

Dieser ganze Vorgang wird 100x wiederholt, wodurch sich die erste Population aus 100 verschiedenen Anordnungen von Städten bildet.

Diese Population wird nun hinsichtlich ihrer Fitness untersucht. Dazu wird von jedem Individuum, also von jeder zufälligen Anordnung der Städte, die Gesamtstrecke berechnet. Aus den Gesamtstrecken ergeben sich dann die Fitnesswerte der Individuuen. Die einzelnen Fitnesswerte werden mit einem entsprechenden Index auf das jeweilige Individuum in einem Dictionary abgespeichert. Abschließend wird das Dictionary bzgl. der Fitnesswerte sortiert.

Mit diesen Fitnesswerten wird nun die erste Selektion vorgenommen um eine neue Population zu bilden. Die neue Population beinhaltet ausschließlich Individuen der Quellpopulation, aber zwangsweise nicht alle. Es kann somit vorkommen, dass ein Individuum mehr als als einmal in der Selektion auftaucht. Biologisch entspricht das der Tatsache, dass ein Lebewesen mit mehreren unterschiedlichen Lebewesen Nachkommen zeugen kann.

Als Selektionsmerkmal wird zum einen Elitarismus genutzt, wodurch die n besten Individuen der Population automatisch selektiert werden.

Und zum anderen wird eine Fitness proportionate selection verwendet, bei der die Selektionswahrscheinlichkeit durch die relative Fitness bzgl. der Population berechnet wird. Dieses Verfahren sorgt dafür, dass Individuen mit einer sehr geringen Fitness mit in die Selektion aufgenommen werden (wenn auch mit einer kleineren Chance). Die selektierten Individuen bilden den sogenannten Paarungspool (Mating pool).

Dieser Paarungspool wird nun genutzt um Nachkommen zu bilden. Dazu werden die neue Population gemischt und es werden die n besten Individuen. Diese Individuen bilden automatisch die nächsten Nachkommen.

Der Rest der Population bilden die Elternteile. Dabei werden iterativ über die Population je zwei Individuen als Vater und als Mutter deklariert, wobei das I-te Individuum den Vater und das len(Population) – I – 1-te die Mutter darstellt. Nach len(Population) / 2 Zyklen tauschen Vater und Mutter die Positionen. 

Beide Eltern erzeugen anschließend die Nachkommen. Auch hier Ähnlich wie in der Biologie werden auch hier bei der Nachkommensbildung unterschiedlich viele Merkmale beider Elternteile verwendet um einen Nachkommen zu zeugen.

Damit ist die Nachkommensbildung abgeschlossen und eine neue Generation der ursprünglichen Population steht bereit.

In der Genetik kommt es allerdings vor, dass zufällige Individuen mutieren und sich verändern. Wenn diese Veränderungen im Sinne des Individuums positiv sind, vererbt es diese Mutationen unter Umständen weiter, wodurch die Nachkommen einen Vorteil gegenüber den Nachkommen von nicht mutierten Individuuen haben. Bisher stellt der Algorithmus eine Welt ohne Evolution dar. Während der Mutation verändern sich einzelne Merkmale eines Individuums. Dies ist in diesem Fall nicht möglich, da die Position der Städte nicht verändert werden kann. Stattdessen wird die Position einer Stadt mit der Position einer anderen zufälligen Stadt getauscht.

Die Mutation wird nun auf die komplette Population angewandt, sodass jedes Individuum der Population die gleiche Chance erhält zu mutieren.

Als Resultat erhält man eine neue Population, die über eine einer besseren Gesamtfitness verfügt als die Ausgangspopulation. Durch mehrmaliges Wiederholen der Vorgänge kann die Fitness bis zu einem bestimmten Wert immer weiter verbessert werden. 

Das Ergebnis des Algorithmus ist eine optimierte Besuchsreihenfolge der Städte (hier als Beispiel für 500 Zyklen).

Der Ergebnisplot auf der rechten Seite zeigt deutlich, dass sich das Ergebnis nach 250 Generationen nicht mehr stark verbessert hat. Meine Implementierung optimiert ggf. zu lange, da sie lediglich einen Zähler als Abbruchvariante verwendet. Hier kann der Algorithmus noch optimiert werden, indem er die Optimierung z. B. beim erreichen einer Mindestfitness abbricht. Die bessere Variante ist allerdings, dass der Algorithmus sich die letzten n Fitnesswerte anschaut und nur abbricht, wenn die Fitness näherungsweise konstant bleibt.

Das komplette Projekt (mit einer schönen Tk-GUI) ist, wie immer, in meinem GitLab-Repository zu finden.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.