Zur innerbetrieblichen Logistik –
Axiomatik und Betrachtung als kinodynamisches
System
Zur Erlangung des akademischen Grades eines
Dr.-Ing.
von der Fakultät Maschinenbau
der Technischen Universität Dortmund
genehmigte Dissertation
Dipl.-Inform. Moritz Johannes Roidl
aus
Hamm (Westfalen), Deutschland
Tag der mündlichen Prüfung: 13.07.2022
Erster Gutachter: Prof. Dr. Dr. h. c. Michael ten Hompel
Zweiter Gutachter: Prof. Dr. Jakob Rehof
Dortmund, 2022

Kurzfassung
Der Anspruch zeitgemäßer Logistikforschung ist die Modellierung ihrer
Herausforderungen und Probleme aus logistischer Sicht. Dabei ist die Be-
trachtung von Einzelproblemstellungen aus Perspektive der beteiligten Dis-
ziplinen und Fachbereiche zu überwinden, um zu einer übergeordneten
Theorie zu finden, die anwendungsunabhängige Gültigkeit besitzt. Ein erster
Schritt zu diesem Ziel wird in dieser Promotionsschrift durch die erstmalige
Definition einer Axiomatik der Logistik versucht.
Zentrale Zielstellung dieser Arbeit ist die Entwicklung eines allgemein-
gültigen Verfahrens kinodynamischer Bewegungsplanung im idealen logisti-
schen Raum auf Basis der Axiomatik. Die zu schließende Forschungslücke
ergibt sich aus der Erkenntnis, dass für das durch den idealen logistischen
Raum repräsentierte idealisierte Förderwesen bislang kein solches Verfahren
existiert. Ein Herausstellungsmerkmal des neuen Verfahrens ist die Verwen-
dung eines kontinuierlichen Weltmodells, das sich von bereits etablierten git-
terbasierten Ansätzen durch die Berücksichtigung kinodynamischer Zwangs-
bedingungen abgrenzt. Das Schließen der Forschungslücke ermöglicht eine
prinzipiell vollständige Beschreibung logistischer Bewegungsplanung.
Das entwickelte Verfahren wird anhand eines neuartigen Transportrobo-
tersystems für hochdynamische Sortieranwendungen validiert. In diesem
Zuge wird das Konzept des Cyberphysischen Zwillings definiert. Damit
einher geht die Konzeptionierung eines Versuchsfelds für die Entwicklung
Cyberphysischer Zwillinge sowie der experimentelle Nachweis, dass ein
schwarmbasiertes Sortiersystem mit diesem Verfahren leistungsfähiger ist
als ein aktuelles Hochleistungssortiersystem mit Stetigfördertechnik.
i

Abstract
The aspiration of contemporary logistics research is its capability to model
its challenges and problems from a logistics perspective. In doing so, the
consideration of individual problems from the perspective of the disciplines
and fields involved must be overcome in order to find a superordinate theory
that holds application-independent validity. A first step towards that goal
is attempted in this dissertation by defining an axiomatic of logistics for the
first time.
The central objective of this thesis is the development of a universally
applicable method of kinodynamic motion planning in the ideal logistic
space based on the axiomatics. The research gap to be filled arises from the
finding that for an idealized transport system, which is represented by the
ideal logistic space, no such method exists so far. A specific feature of the new
method is the use of a continuous world model, which differs from already
established grid-based approaches by considering kinodynamic constraints.
In principle, closing this research gap enables a complete description of
logistic motion planning.
The developed method is validated using a novel transport robot system
for dynamic sorting applications with high throughput. In doing so, the
concept of a Cyberphysical Twin is defined. This is accompanied by the
design of an experimentation environment for the development of Cyber-
physical Twins as well as the experimental evidence that a swarm-based
sorting system using this method is more performant than a state-of-the-art
high-performance sorting system with continuous conveyor technology.
iii

Inhaltsverzeichnis
Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii
1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Forschungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Vorgehen und Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.1 Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2 Cyberphysische Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 Digitaler Zwilling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Planung und Verwaltung von Objektbewegungen . . . . . . . . . . . 26
2.4.1 Grundlagen der Bewegungsplanung . . . . . . . . . . . . . . . . . 31
2.4.2 Bewegungsplanung in diskreten Weltmodellen . . . . . . . 33
2.4.3 Bewegungsplanung in kontinuierlichen Weltmodellen 36
2.4.4 Zeitabhängige Bewegungsplanung . . . . . . . . . . . . . . . . . . 47
2.4.5 Bewegungsplanung für mehrere Objekte . . . . . . . . . . . . . 49
2.4.6 Planung unter differenziellen Zwangsbedingungen . . . 52
3 Axiomatik der Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.1 Motivation für eine axiomatische Betrachtung . . . . . . . . . . . . . . . 62
3.2 Aufbau der Axiomatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.3 Zur Beobachtung in logistischen Systemen . . . . . . . . . . . . . . . . . . 82
3.4 Konzeption eines Cyberphysischen Zwillings . . . . . . . . . . . . . . . 84
4 Anforderungen, existierende Arbeiten und Forschungslücke . . . . 89
4.1 Anforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
4.2 Existierende Arbeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
4.2.1 Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
v
vi Inhaltsverzeichnis
4.2.2 Robotik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
4.3 Grenzen existierender Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.4 Forschungslücke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
5 Verfahren zur kinodynamischen Bewegungsplanung . . . . . . . . . . . 101
5.1 Gestaltung des idealen logistischen Raums . . . . . . . . . . . . . . . . . 102
5.2 Bestandteile und Ablauf des Verfahrens . . . . . . . . . . . . . . . . . . . . 104
5.3 Splinebasierte Trajektorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
5.4 Numerisches Geschwindigkeitsprofil . . . . . . . . . . . . . . . . . . . . . . . 119
5.5 Bestimmung der Geschwindigkeiten . . . . . . . . . . . . . . . . . . . . . . . 127
5.6 Kollisionsfreie Bewegung mehrerer Objekte . . . . . . . . . . . . . . . . . 131
5.6.1 Das Verfahren als Zustandsautomat . . . . . . . . . . . . . . . . . . 141
5.6.2 Heuristische Verbesserung . . . . . . . . . . . . . . . . . . . . . . . . . . 145
6 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
6.1 Testbed für die Entwicklung Cyberphysischer Zwillinge . . . . . 148
6.2 Empirische Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.3 Simulationsstudie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
6.3.1 Versuchsdurchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
6.3.2 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.4 Kritische Reflexion der Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . 164
7 Ergebniszusammenfassung und Forschungsausblick . . . . . . . . . . . 169
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
Abbildungsverzeichnis
1.1 Industrie-4.0-Reifegradindex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Entwicklung einer Logistik 4.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Vorgehen und inhaltliche Struktur der Forschungsarbeit . . . . . . . . . 8
2.1 Zusammenhang von Liefer-, Auftragsdurchlauf- und
Materialdurchlaufzeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Sortertopologien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Mehrebenensteuerung der Regelungstechnik . . . . . . . . . . . . . . . . . . . . 15
2.4 Grundstruktur eines Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.5 Grundstruktur des Digitalen Zwillings . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.6 Digitaler Zwilling im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.7 Digitaler Zwilling eines Roboters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.8 Kollision durch Kreuzung und Überlappung . . . . . . . . . . . . . . . . . . . . 26
2.9 Frontal- und Heckkollision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.10 Staubildung durch Warten im Stillstand . . . . . . . . . . . . . . . . . . . . . . . . 28
2.11 Entstehung eines Livelocks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.12 Entstehung eines lokalen Deadlocks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.13 Entstehung eines nichtlokalen Deadlocks . . . . . . . . . . . . . . . . . . . . . . . 29
2.14 Unendliches gitterbasiertes Weltmodell . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.15 Endliches gitterbasiertes Weltmodell mit Hindernissen . . . . . . . . . . . 34
2.16 Ungünstige Trajektorie für kinodynamische Bewegungsplanung . 59
3.1 Beispiele gitterbasierter und freier Bewegung in der Logistik . . . . . 62
3.2 Beispiel der Erdoberfläche als Mannigfaltigkeit . . . . . . . . . . . . . . . . . . 66
3.3 Beispiel zellularer Strukturen im Mobilfunk . . . . . . . . . . . . . . . . . . . . . 66
3.4 Beispiel einer Mannigfaltigkeit in der Intralogistik . . . . . . . . . . . . . . . 67
3.5 Topologische Umgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.6 Beispiel eines logistischen Raums mit Orten . . . . . . . . . . . . . . . . . . . . . 69
3.7 Beispiel eines Blockzeilenlagers und seiner räumlichen Struktur . . 69
3.8 Beinhalten und Vereinigung von logistischen Objekten . . . . . . . . . . . 72
vii
viii Abbildungsverzeichnis
3.9 Beispiel einer räumlichen Struktur auf einem Ladehilfsmittel . . . . . 73
3.10 Palettendurchlaufregal als kinodynamisches System . . . . . . . . . . . . . 73
3.11 Nachbarschaft logistischer Objekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.12 Logistischer Weg und Homotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.13 Disjunkte logistische Wege und Wege mit Konfliktzonen . . . . . . . . . 77
3.14 Beispiele logistischer Warteschlangen . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.15 Idealisiertes Förder- und Lagerwesen . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
3.16 Cyberphysischer Zwilling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.17 Systeme von verteilten Cyberphysischen Zwillingen . . . . . . . . . . . . . 87
4.1 Vorgehen zur Bestimmung der Forschungslücke . . . . . . . . . . . . . . . . 90
5.1 Objekte im idealen logistischen Raum . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.2 Last- und Leerfahrt im idealen logistischen Raum . . . . . . . . . . . . . . . 103
5.3 Datenstruktur der Bewegungskoordination . . . . . . . . . . . . . . . . . . . . . 105
5.4 Bestandteile des entwickelten Verfahrens . . . . . . . . . . . . . . . . . . . . . . . 108
5.5 Homotope Pfade im idealen logistischen Raum. . . . . . . . . . . . . . . . . . 109
5.6 Beispiel eines Catmull-Rom-Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
5.7 Unterschiedliche Parametrisierung eines Catmull-Rom-Splines . . . 119
5.8 Bahnkurve mit Krümmungskreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.9 Schema der Krümmung am Kreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
5.10 Standardfahrrampe und spitze Fahrrampe . . . . . . . . . . . . . . . . . . . . . . 130
5.11 Worst-Case-Szenario für die Laufzeit des Verfahrens . . . . . . . . . . . . . 140
5.12 Verfahren zur Kollisionsvermeidung als Zustandsautomat . . . . . . . 142
5.13 Veranschaulichung der Kollisionsvermeidung . . . . . . . . . . . . . . . . . . . 143
5.14 Weiterentwickelter Zustandsautomat zur Kollisionsvermeidung . . 144
5.15 Trajektorien auf der Basis homotoper Bahnkurven . . . . . . . . . . . . . . . 145
6.1 Gesamtansicht des Testbeds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
6.2 Architektur der Entwicklungsumgebung des Testbeds . . . . . . . . . . . 150
6.3 Designstudie des Loadrunners . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
6.4 Simulationsumgebung für die Entwicklung und Evaluation des
Loadrunners . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
6.5 Loop-Sorter mit einem Einschleusbereich . . . . . . . . . . . . . . . . . . . . . . . 154
6.6 Loop-Sorter mit zwei Einschleusbereichen . . . . . . . . . . . . . . . . . . . . . . 155
6.7 Loadrunner-Sortiersystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
6.8 Screenshot des Basisszenarios vor der Simulation . . . . . . . . . . . . . . . . 160
6.9 Screenshot des Basisszenarios während der Simulation . . . . . . . . . . 160
6.10 Leistungswerte im Basisszenario bei 4m/s2 . . . . . . . . . . . . . . . . . . . . . 160
6.11 Leistungswerte im Basisszenario bei 5m/s2 . . . . . . . . . . . . . . . . . . . . . 161
6.12 Layout des erweiterten Szenarios vor dem Start der Simulation . . . 162
6.13 Screenshot des erweiterten Szenarios vor der Simulation . . . . . . . . . 162
6.14 Screenshot des erweiterten Szenarios während der Simulation . . . . 162
Abbildungsverzeichnis ix
6.15 Leistungswerte im erweiterten Szenario bei 4m/s2 . . . . . . . . . . . . . . 163
6.16 Leistungswerte im erweiterten Szenario bei 5m/s2 . . . . . . . . . . . . . . 163

Kapitel 1
Einleitung
Die Logistik ist die bewegende Instanz der vierten industriellen Revolution.
Sie wird als vorrangiges Anwendungsfeld für die Einführung cyberphysi-
scher Systeme gesehen und gilt als die Branche, in der das Internet der Dinge
seine vollständige Umsetzung erfahren wird. Zugleich wurde die Hypothese
aufgestellt, dass Produktions- und Logistiksysteme auf Basis sich selbst steu-
ernder, weitgehend autonomer cyberphysischer Systeme flexibler einsetzbar
und zugleich effizienter und leistungsfähiger seien.
Diese Promotionsschrift widmet sich den grundlegenden wissenschaftli-
chen Gestaltungsprinzipien für die Bewegungsplanung in Logistiksystemen.
Die zentrale Zielsetzung der Arbeit kann folgendermaßen beschrieben wer-
den: Entwicklung eines allgemeingültigen Verfahrens kinodynamischer Bewegungs-
planung im idealen logistischen Raum auf Basis einer Axiomatik der Logistik.
Zur Erreichung der vorgenannten Zielsetzung wird im Rahmen der Arbeit
erstmalig eine Axiomatik der Logistik entwickelt, die sich an der theoreti-
schen Bewegungsplanung der Robotik orientiert und diese mit Begriffen der
Logistik verbindet. Auf Basis der Axiomatik wird eine Forschungslücke unter
den Verfahren der Bewegungsplanung für logistische Systeme identifiziert.
Ein solches Verfahren wird für den idealen logistischen Raum entwickelt und
anhand des Cyberphysischen Zwillings eines neuartigen Transportroboters
validiert. Ein Herausstellungsmerkmal des Verfahrens ist die Verwendung
eines kontinuierlichen Weltmodells im Gegensatz zu gitterbasierten Ansät-
zen. Die Validierung zeigt, dass ein Schwarm autonomer Transportroboter
durch das Verfahren in der Lage ist, die Leistung eines stetig fördernden,
klassischen Hochleistungssortiersystems deutlich zu übertreffen.
1.1 Motivation
Diese Arbeit ist im Kern durch eine fehlende wissenschaftliche Betrach-
tung der Bewegungsplanung in der Logistik motiviert. Es gibt bislang keine
wissenschaftlichen Grundlagen für eine einheitliche und anwendungsunab-
1
2 1 Einleitung
hängige Entwicklung von Verfahren der Bewegungsplanung in logistischen
Systemen. Insbesondere die Abhängigkeit von manuell erstellten, anwen-
dungsnahen Modellen der Logistik, die auf eine menschliche Beobachtung
spezifischer existierender Systeme zurückgehen, schränkt den Betrachtungs-
raum bisheriger Logistikforschung ein.
Wenn die Logistik die bewegende Instanz einer Industrie 4.0 sein soll, dann
ist es notwendig, deren neue Prinzipien als Grundlage für eine wissenschaft-
liche Definition der Logistik aufzugreifen. Anschaulich lässt sich das anhand
von Abbildung 1.1 erkennen. Auf Basis der Digitalisierung industrieller
Systeme, die durch eine Computerisierung und Kommunikationsfähigkeit
gekennzeichnet ist, entsteht eine Industrie 4.0 durch Sichtbarkeit und Transpa-
renz. Gemeint ist damit, dass eine erhöhte technische Wahrnehmungsfähig-
keit der Systeme zu einer automatisierten Erkennung ihres Zustands und –
das ist im Fall der Logistik wichtig – ihrer physischen Umgebung führt. Im
Prinzip wird damit eine datengetriebenen Welt beschrieben, in der Modelle
nicht mehr manuell erstellt, sondern erlernt und laufend angepasst werden
können. So wird eine automatisierte Prognosefähigkeit und Adaptierbarkeit
erreicht.
Digitalisierung Industrie 4.0
Sichtbarkeit, Transparenz Adaptierbarkeit
und
Computerisierung Prognosefähigkeit
und
Kommunikation
1 2 3 4 5 6
Abb. 1.1 Industrie-4.0-Reifegradindex nach [Sch+17]
Übertragen auf eine Logistik 4.0 kommt der technischenWahrnehmungsfähig-
keit eine neue, essenzielle Rolle zu. Der Entwurf eines logistischen Systems
beginnt nicht mehr mit der Auswahl physischer Systemkomponenten. Viel-
mehr gilt es, zuerst das Abbild des physischen Raums zu definieren, in dem
die Bewegung von Objekten geplant wird. Abbildung 1.2 veranschaulicht
diese Vorgehensweise: Transparenz, Prognosefähigkeit und Adaptierbarkeit
sind Eigenschaften, die durch den Entwurf eines logistischen Raums ermög-
licht werden. Dieser Gedankengang findet sich implizit in einer als rich-
tungsweisende Forderung aufgestellten Aussage in einem Artikel über einen
Nutzen
1.1 Motivation 3
Paradigmenwechsel in der Logistik im Kontext von Industrie 4.0 (vgl. [tK15]):
Der ideale logistische Raum ist leer.
Der Artikel beschreibt die Herausforderungen beim Entwurf logistischer
Systeme unter einer steigenden Volatilität des Produktions- und Handels-
umfeldes. Die erforderliche zukünftige logistische Leistung eines Systems
muss demnach bereits zu Beginn für Jahre im Voraus bestimmt werden. Die
Unwägbarkeiten bei der Bestimmung führen zu einer maximalen Leistung,
die als technische Grenzleistung vom System gefordert wird. Nach dem
Artikel basieren die existierenden analytischen Entwurfsmethoden zu weiten
Teilen auf diesen Grenzleistungsrechnungen, die einzeln für die jeweiligen
Systemkomponenten durchgeführt werden. Neben den groben analytischen
Methoden werden Methoden der Materialflusssimulation mit Modellen in
unterschiedlichen Abstraktionsgraden verwendet. Diese Vorgehensweise
führt zu hochperformanten Systemen, die im Gegenzug unflexibel und nur
bedingt skalierbar sind.
Digitalisierung Logistik 4.0
cyberphysische kontinuierliche
Systeme Wahrnehmung
idealer 
Datenströme logistischer Raum
1 2 3 4 5 6
Abb. 1.2 Entwicklung einer Logistik 4.0
Der hauptsächliche Grund dieser Inflexibilität ist die fest verbaute lokale In-
frastruktur klassischer, hochperformanter Intralogistiksysteme. Ein Beispiel
sind Sortiersysteme, die in Abschnitt 2.1 beschrieben werden. Sie bestehen
aus fest verbauter Stetigfördertechnik, die über klassische Automatisierungs-
technik gesteuert wird. Diese Systeme sind aufwändig über physische Bau-
maßnahmen zu ändern und entsprechend schwierig ist eine Änderung des
Standorts, in den meisten Fällen nur unwirtschaftlich zu erreichen ist.
4 1 Einleitung
1.2 Forschungsfragen
In den folgenden Abschnitten soll der Begriff des idealen, leeren logistischen
Raums genauer untersucht werden, um darüber die zentralen Forschungs-
fragen und Hypothesen dieser Arbeit herzuleiten.
Der ideale Raum
In der Analyse logistischer Systeme kann ein idealer Raum als Idealtypus ver-
standen werden, der keine bekannten Systeme abbildet, sondern alsMesslatte
dient, um die logistische Wirklichkeit trennscharf analysieren zu können.
Beim Entwurf logistischer Systeme ist ein idealer Raum hingegen als Vollkom-
menheitsmuster anzusehen, dem der Entwurf als Leitlinie folgt, deren Realisie-
rung nicht vollständig erfüllt werdenmuss. Diese Ansicht impliziert, dass der
ideale Raum Teil eines multikriteriellen Optimierungsprozesses ist, dessen
spezifische Eigenschaften die Minimierungs- und Maximierungsstrategien
beim Entwurf eines Systems beeinflussen. Dabei stellt sich grundsätzlich die
Frage, ob es einen einzigen idealen Raum für alle logistischen Systeme gibt
oder mehrere Arten idealer Räume existieren können.
Der logistische Raum
Über den Begriff des logistischen Raums findet sich in der Literatur weder
eine einheitliche noch eine formale Definition. In einer internationalen Li-
teraturübersicht zum englischen Begriff Logistics Spacewird der logistische
Raum als System von Räumen beschrieben, das aus Logistikunternehmen,
Logistikknoten, Logistikinfrastruktur und Industrieunternehmen besteht
(vgl. [He+18]). Der logistische Knoten, wie etwa ein Logistikzentrum oder ein
Distributionzentrum, gilt als räumliches Hauptelement, das die logistischen
Aktivitäten wahrnimmt. Dieser Logistikknoten beschreibt den Bereich, der
in der deutschsprachigen Literatur die Domäne der Intralogistik umfasst.
Wenn in dieser Arbeit vom logistischen Raum die Rede ist, dann steht die
Intralogistik innerhalb eines solchen Logistikknotens im Mittelpunkt.
Eine offene Fragestellung ist, wie ein logistischer Raum formal definiert
werden soll, sodass wesentliche Aspekte logistischer Systeme beschrieben
werden können. Ist es möglich, die Raumbegriffe anderer Disziplinen zu
adaptieren, und welche Unterschiede ergeben sich aus einer vergleichenden
Betrachtung?
Spezifisch stellt sich diese Arbeit die Frage, ob der Raumbegriff der Ro-
botik für die Logistik genutzt werden kann. Kann das Konzept des Roboters
verallgemeinert aufgefasst werden, sodass es beliebige Objekte und auch den
Menschen beinhaltet?
1.2 Forschungsfragen 5
Der leere Raum
Der Begriff des leeren Raums kann umgangssprachlich als ein Raum aufgefasst
werden, der nichts enthält. Im Gegensatz dazu enthält ein Logistiksystem
eine Infrastruktur sowie physische Objekte, deren Bewegung zur logistischen
Hauptaktivität gehört.Wenn der leere Raum keine Objekte enthält, dann steht
dieser Zustand im Widerspruch zur Leistungserbringung des logistischen
Systems, für die möglichst viele Objekte in kurzer Zeit hindurchbewegt
werden müssen, also der Raum eigentlich möglichst gefüllt sein sollte.
Dementsprechend kann es von Vorteil sein, den leeren Raum dynamisch
zu betrachten. Die bewegten Dinge treten in den Raum ein, werden bewegt
und verlassen den Raum wieder. Damit ist der leere Raum Ausgangszustand
und zugleich Endzustand der logistischen Aktivität.
Damit stellt sich die Frage, ob sich der leere Raum nur auf den Teil eines
logistischen Systems bezieht, der für Objektbewegungen verwendet wird. In
diesem Sinne kann der leere Raum als frei von Hindernissen im Sinne der Bewe-
gungsplanung gedacht werden. Diese Hindernisse beinhalten offensichtlich
bauliche Strukturen sowie die Infrastruktur des Logistiksystems. Zusätzlich
zu diesen statischen Hindernissen kinematischer Art können dynamische
Hindernisse die Freiheit einschränken. Dazu zählen Objekte und Menschen,
die sich im Raum bewegen.
Neben dynamischen und statischen Hindernissen kann die Bewegungs-
freiheit auch durch algorithmische Strukturen eingeschränkt werden. Fest
vorgegebene Fahrwege oder gitterbasierte Straßenkarten können den mögli-
chen Raum für eine Objektbewegung beschränken. Insofern steht der leere
Raum auch für eine größtmögliche Bewegungsfreiheit in Bezug auf die algorith-
mische Ausführung der Bewegungssteuerung.
Ein weiterer Aspekt ist die Mobilität der lokalen Infrastruktur selbst. Wie
zu Anfang dieses Abschnitts beschrieben, ist der ideale Standort eines Lo-
gistiksystems und damit der Ort des logistischen Raums nicht dauerhaft
festlegbar. Jede fest verbaute Infrastruktur, wie etwa Förderbänder und fest
verkabelte Automatisierungstechnik, verhindert eine einfache Verlegung
des logistischen Raums. Der leere Raum steht unter diesem Aspekt für die
Abwesenheit fest verbauter Infrastruktur.
6 1 Einleitung
Annahmen und Vorraussetzungen
Im Folgenden sollen einige grundlegende Annahmen getroffen werden, auf
denen die Hypothesen dieser Arbeit aufbauen. Diese Annahmen werden an
dieser Stelle der Arbeit zur besseren Nachvollziehbarkeit beschrieben. Sie
gehen auf die oben beschriebenen Prinzipien der Industrie 4.0 ein und fassen
wesentliche Aspekte des Grundlagenkapitels zusammen:
• Der logistische Raum ist ein dezentraler, konsensfähiger Informati-
onsraum.
Der Zustand des logistischen Raums bestimmt sich ausschließlich durch
dezentrale, lokal erfasste Beobachtungen. Diese Beobachtungsereignisse
werden durch Kommunikationsvorgänge mit zeitlicher Verzögerung ag-
gregiert. Je umfassender und zentraler die Aggregation geschieht, desto
mehr Zeitverzögerung ergibt sich zwischen dem Abbild der Wirklichkeit
und dem tatsächlichen physischen Zustand. Konsensfähigkeit bedeutet,
dass es möglich ist, einen allgemein akzeptierten Zustand des Informati-
onsraums zu erreichen, auf dem eine Planung von Objektbewegungen
möglich wird. Die technischen Maßnahmen zur Erreichung der Konsens-
fähigkeit sind Teil des Entwurfs eines logistischen Systems.
• Kontinuierliche Wahrnehmung des physischen Raums
Es wird in dieser Arbeit davon ausgegangen, dass eine örtlich begrenzte
Wahrnehmung physischer Objekte, insbesondere die regelmäßige, in
sehr kurzen Zeitabständen erfolgende Bestimmung von Position und
Rotation, möglich ist.
• Örtlich begrenzte Kommunikationsfähigkeit aller in physische Ob-
jekte eingebetteten Computersysteme
Es gibt eine grundsätzliche, technische Kommunikationsfähigkeit, die
es allen eingebetteten Computersystemen erlaubt, örtlich begrenzt In-
formationen auszutauschen. Diese Kommunikationsfähigkeit unterliegt
technischen Beschränkungen, sodass Latenzzeiten und eine beschränkte
Datenübertragungsrate berücksichtigt werden müssen. Die Übertragung
von Nachrichten ist zuverlässig, sodass eine Nachricht nicht verloren
gehen kann. Es wird weder von einer Einhaltung der Reihenfolge von
Nachrichten ausgegangen, noch von einer garantierten Übertragungszeit.
Auf Basis dieser Voraussetzungen können die Hypothesen aufgestellt werden.
Es sei angemerkt, dass diese Annahmen nicht bedeuten, dass sie für darauf
aufbauende Systeme und ihre Algorithmen transparent sind. Im Gegenteil
beeinflussen die technischen Einschränkungen von Wahrnehmungs- und
Kommunikationsfähigkeit alle weiteren Systeme und müssen zwingend
berücksichtigt werden.
1.3 Hypothesen 7
1.3 Hypothesen
Diese Arbeit untersucht die folgenden Hypothesen zum logistischen Raum.
Dabei werden die in den Grundlagen betrachteten Themengebiete verwendet,
um eine einheitliche und neue Sicht auf den Entwurf logistischer Systeme zu
erarbeiten.
H1. Der ideale logistische Raum ist leer, kontinuierlich und kinodyna-
misch. Wenn der ideale logistische Raum leer ist, dann ist eine durch
die Bewegungsplanung vorgegebene diskrete, gitterbasierte Struktur für
die Leistung eines Logistiksystems nachteilig. Kontinuierliche Zustands-
variablen, die Geschwindigkeit, Beschleunigung und Ruck abbilden,
ermöglichen in der Praxis hohe Geschwindigkeits- und Beschleunigungs-
werte.
H2. Eine axiomatische Definition der Logistik ist auf Basis des Konzepts
des idealen logistischen Raums möglich. Im Gegensatz zu einer Defi-
nition der Logistik, die auf der Einordnung und Generalisierung von
bekannten Anwendungen und Systemtypen basiert, kann eine axiomati-
sche Definition auf Basis des Konzepts des logistischen Raums entwickelt
werden. Eine solche Definition hat den Vorteil, auch für unbekannte, noch
nicht entwickelte Technologien gültig zu sein.
H3. Es gibt einen effizient durchführbaren Planungsalgorithmus für eine
Vielzahl von bewegten Objekten im idealen logistischen Raum. Es
kann ein effizienter, allgemeingültiger Planungsalgorithmus entwickelt
werden, der für eine Vielzahl logistischer Objekte die Durchführbarkeit
einer konfliktfreien Bewegung sicherstellt (im Sinne einer Feasibility, vgl.
Unterabschnitt 2.4.1).
H4. Eine dezentrale Steuerung logistischer Systeme auf Basis des Pla-
nungsalgorithmus lässt sich mit dem Konzept des Cyberphysischen
Zwillings umsetzen. Das Konzept des Digitalen Zwillings lässt sich
durch Spezialisierung anpassen, um die axiomatische Definition der Lo-
gistik um die Aspekte Dezentralisierung, Modularität und Skalierbarkeit
zu ergänzen.
H5. Ein Hochleistungssortiersystem mit klassischer Stetigfördertechnik
kann durch einen Schwarm hochdynamischer Transportroboter er-
setzt werden. Es kann nachgewiesen werden, dass ein Transportroboter-
schwarm auf Basis des entwickelten Planungsalgorithmus die Leistung
eines Hochleistungssortiersystems traditioneller Bauart erreicht.
8 1 Einleitung
1.4 Vorgehen und Struktur
Dem Forschungsziel wird sich sukzessive genähert, indem zunächst die
Grundlagen der Logistik sowie der theoretischen Bewegungsplanung in der
Robotik beschrieben werden (Kapitel 2). Darauf aufbauend wird eine axioma-
tische Definition der Logistik entwickelt, deren Kernkonzept der logistische
Raum ist. Ergänzt wird das Konzept durch den Cyberphysischen Zwilling
als Abstraktion dezentraler Steuerung, virtueller Abbildung und Simulation
(Kapitel 3). Anschließend werden in Kapitel 4 die Anforderungen an eine
Bewegungsplanung spezifiziert, existierende Arbeiten betrachtet und die
Forschungslücke bestimmt. Kapitel 5 widmet sich der Verfahrensentwick-
lung und Kapitel 6 der Evaluation. Kapitel 7 enthält die Zusammenfassung
und den Forschungsausblick.
Vorgehen Inhaltliche Bausteine
Grundlagen
§ Klassische Logistik Grundlagen Logistik Interdisziplinäres
§ Cyberphysische Systeme Gesamtbild
§ Digitaler Zwilling Grundlagen der Grundlagen
Bewegungsplanung
§ Theorie der Bewegungsplanung (Robotik)
Neudefinition der Logistik
§ Axiomatik der Logistik Axiomatik der 
Logistik Basis für die 
§ Cyberphysischer Zwilling Verfahrens-
Cyberphysischer entwicklung
Zwilling
Anforderungen Anforderungs-
§ Anforderungen an das Verfahren spezifikation
Forschungslücke
§ Grenzen bisheriger Bisherige 
Forschungsarbeiten Forschungsarbeiten 
Eigener Lösungsentwurf Formale Beschreibung 
§ Entkoppelte und priorisierte der Problemstellung
Bewegungsplanung
§ Splinebasierte Trajektorienplanung Auswahl von Bewertungsrahmen 
§ Konfliktlösung durch parallele Methoden des Verfahrens
Simulation und Anpassung von 
Geschwindigkeitsprofilen 
Algorithmen
Evaluation
Empirische 
§ Testbed für Cyberphysische Untersuchungen Simulationsstudie
Zwillinge 
§ Empirische Untersuchungen Verfahrensbewertung, 
§ Simulation großer Sortiersysteme kritische Reflexion
Abb. 1.3 Vorgehen und inhaltliche Struktur der Forschungsarbeit
Prüfung Verfahrensentwicklung Forschungs-lücke Axiomatik Grundlagen
Kapitel 2
Grundlagen
Zusammenfassung Das zweite Kapitel erläutert zunächst das Forschungs-
umfeld und die terminologischen und technologischen Grundlagen dieser
Arbeit, insbesondere den engen Zusammenhang zwischen den Fachbereichen
der Logistik und der Robotik. Zu Beginn werden die Grundbegriffe der Lo-
gistik sowie der innerbetrieblichen Materialflusssteuerung und -simulation
eingeführt. Anschließend werden cyberphysische Systeme und verwandte
Themenbereiche wie Dezentralisierung und Echtzeitfähigkeit beschrieben.
Es wird das Paradigma des Digitalen Zwillings eingeführt. Anschließend
widmet sich das Kapitel in einem umfangreichen Abschnitt der Theorie
der Bewegungsplanung aus dem Fachbereich der Robotik. Neben der Pla-
nung in diskreten Weltmodellen wird insbesondere auf die Planung in kon-
tinuierlichen Weltmodellen unter kinodynamischen Zwangsbedingungen
eingegangen.
9
10 2 Grundlagen
2.1 Logistik
Die Grundbegriffe der Logistik, wie sie für den Zweck dieser Arbeit benötigt
werden, stammen im Wesentlichen aus dem ersten Kapitel des Handbuch
Logistik und sind hier in geeigneterWeise zusammengefasst und kommentiert
(vgl. [Arn+08a]). Da diese Begriffe im Laufe der Arbeit teilweise neu definiert
werden, beschränkt sich dieser Abschnitt auf die relevanten klassischen
Grundbegriffe. Für eine ausführliche Erörterung der klassischen Sichtweise
auf die Logistik sei auf das Handbuch oder weitere hier genannte Quellen
verwiesen.
Zu den Grundbegriffen gehört das Logistikobjekt, das allgemein Waren, Gü-
ter, Personen oder Lebewesen bezeichnet. Logistikobjekte werden inMengen
quantifiziert, die zu bestimmten Zeitpunkten an bestimmten Orten existieren
(vgl. [Gud10a, S. 3]).
Logistikobjekte und Orte befinden sich in einem logistischen System, in
dem logistische Prozesse durchgeführt werden, die in (Orts-)Veränderungen
an den Mengen über die Zeit resultieren. Ein logistisches System dient der
grundlegenden Strukturierung und kann selbst wieder Subsysteme enthalten
und Teil von Supersystemen sein. Die Bedeutung der Logistik kann daher
sehr allgemein als Gestaltung logistischer Systeme und logistischer Prozesse
definiert werden (vgl. [Arn+08a, S. 3]).
Darüber hinaus sieht [Arn+08a] ein wesentliches Merkmal in der gezielten
Steuerung der Prozesse, insbesondere bei der Bewegung von Objekten. Der
Austausch von Informationen über die räumliche Distanz ist notwendige
Voraussetzung für das Funktionieren des Systems. Jedes logistische System
besitzt ein Informations- und Kommunikationssystem, dessen Gestaltung zur
Logistik gehört.
Ein weiteres klassisches Merkmal der Logistik ist die umfassende Betrach-
tung aller Prozesse in einem System, dessen Struktur als Netzwerk aus Orten
und Wegen aufgefasst wird. Die Wege bilden Verbindungslinien, über die
sich Objekte bewegen. Alle Bewegungsvorgänge werden als Fluss aufgefasst,
der gesteuert werden muss.
Nach [Arn+08a] gilt als Besonderheit das logistische Denken bei der Gestal-
tung des Netzwerks, nach dem die Abstimmung aller Prozesse im Hinblick
auf das Gesamtsystemverhalten Vorrang vor der Betrachtung einzelner Pro-
zesse hat. Dies erfordert zudem, dass die Grenzen eines logistischen Systems
nicht zu eng gesetzt oder zu scharf gezogen werden sollten.
Die klassische Literatur betont bei der Betrachtung der Logistik als Wis-
senschaftsdisziplin den interdisziplären Charakter, der zum einen durch die
Notwendigkeit zu einer ganzheitlichen Sichtweise begründet wird und zum
anderen aus dem spezifisch physischenMerkmal der Betrachtungsgegenstän-
de entsteht (vgl. [Arn+08a, S. 4]). Nach [Gud10a, S. 4] hat die Logistik den
2.1 Logistik 11
Status einer Hilfswissenschaft und ist Gegenstand der Wirtschaftswissen-
schaften, der Ingenieurwissenschaften und der Informatik.
Aufgaben und Ziele
Die Aufgabe jedes logistischen Handelns ist die effiziente Bereitstellung der
geforderten Quantitäten benötigter Materialien in der richtigen Zusammen-
setzung zur rechten Zeit am richtigen Ort. Dazu werden Prozesse, Strukturen
und Systeme entwickelt und organisiert [Gud10a, S. 3].
Aus der allgemeinen Aufgabenstellung der Logistik ergibt sich die all-
gemeine Transportaufgabe, die sich mit der Veränderung des räumlichen
Daseins von Logistikobjekten befasst (vgl. [Arn+08b], S. 393).
Allgemeine Transportaufgabe
„Ein Transportsystem ist so zu gestalten, zu dimensionieren, zu organi-
sieren und zu disponieren, daß ein bestimmter Beförderungsbedarf
unter Berücksichtigung der räumlichen, zeitlichen und technischen
Randbedingungen kostenoptimal erbracht wird.“ (vgl. [Gud10b], S.
771)
Nach [Gud10b] besteht das Gestalten aus dem Zusammenfügen eines Trans-
portnetzes auf Basis von Transportelementen und der Auswahl geeigneter
Transportmittel. Das Dimensionieren umfasst die Festlegung der Transportwe-
ge in Bezug auf Lage und Länge, das Organisieren den allgemeinen Aufbau
der Steuerung und das Disponieren die Strategien, nach denen Transportauf-
träge durch Transportmittel ausgeführt werden.
Die Definition quantitativer Ziele erfolgt in der Logistik über Kennzahlen-
systeme, die hierarchisch aufgebaut sind und eine Menge an Einzelkennzah-
len, die untereinander in einer Systematik verknüpft sind, zu sogenannten
Spitzenkennzahlen verdichten (vgl. [Arn+08b], S. 398ff). Die Spitzenkenn-
zahlen der Logistik sind
• die Auftrags- und Materialdurchlaufzeit,
• der Lieferservicegrad,
• der Bestand,
• die Umschlaghäufigkeit und
• die Logistikkosten.
In Bezug auf die allgemeine Transportaufgabe ist die Minimierung der
Auftrags- und Materialdurchlaufzeit die grundlegende Zielsetzung. In Ab-
bildung 2.1 wird der Zusammenhang zwischen Auftragsabwicklung und
Lieferzeit veranschaulicht.
12 2 Grundlagen
Eingang Disposition Versand Empfang
Materialdurchlaufzeiten
Auftragsdurchlaufzeit
Lieferzeit
Abb. 2.1 Zusammenhang von Lieferzeit, Auftragsdurchlaufzeit und
Materialdurchlaufzeiten
Die Auftrags- und Materialdurchlaufzeiten beeinflussen direkt den Lieferser-
vicegrad und haben indirekt Einfluss auf den Bestand und die Umschlaghäu-
figkeit.
Leistung
Für den allgemeinen Leistungsbegriff in logistischen Systemen sei auf
[Arn+08b] verwiesen. Die quantitative Leistung eines Transportsystems ist
durch die Anzahl an Aufträgen gekennzeichnet, die über einen begrenz-
ten Zeitraum erfolgreich ausgeführt werden. Der Erfolg wird dabei durch
Randbedingungen wie die Einhaltung eines Liefertermins zur Erhöhung
des Lieferservicegrads beeinflusst. Eine qualitative Leistung kann über die
erfolgreiche Erbringung eines im Voraus vorgegebenen Beförderungsbedarfs
definiert werden. Die maximal mögliche Leistung eines Systems, auch Grenz-
leistung genannt, sollte den maximal erforderlichen Beförderungsbedarf
erreichen oder übertreffen.
Generell gilt für klassische Logistiksysteme, dass eine hohe Leistung mit
einem erhöhten Bedarf an Fläche und Transportmitteln sowie mit einem
hohen Automatisierungsgrad verbunden ist. Die klassischen Systeme mit
den höchsten Leistungen zeichnen sich durch eine vollautomatisierte, fest
verbaute Infrastruktur aus (siehe in Abschnitt 2.1 das Beispiel der Sortiersys-
teme).
Kosten
Die betriebswirtschaftliche Betrachtung der anteiligen Logistikkosten wird
über alle logistikrelevanten Kostenstellen abgebildet, die z. B. Disposition,
Einkauf und den innerbetrieblichen Transport umfassen und anfallende Kos-
tenarten im Bereich der laufenden Personal-, Betriebsmittel- und Raumkosten
berücksichtigen (vgl. [Arn+08b], S. 398ff).
2.1 Logistik 13
Die Investitionskosten eines Transportsystems werden maßgeblich vom
maximalen Beförderungsbedarf bestimmt, der den Flächenbedarf sowie die
Anzahl Transportmittel und -elemente beeinflusst, die zur Erreichung der
notwendigen Grenzleistung dienen. Ändert sich der Beförderungsbedarf, so
entstehen Kosten für Umbau und Erweiterung.
Effizienz
Ein Logistiksystem ist effizient, wenn es seine Anforderungen zu den ge-
ringstmöglichen Kosten erfüllt. Im Fall eines vollautomatisierten Transport-
systems für hohe Leistungen bedeutet dies, dass die kostenbestimmende
Grenzleistung möglichst genau den Beförderungsbedarf abbilden sollte. Die
Herausforderung bei der Gestaltung von Transportsystemen ist, diesen op-
timalen Betriebspunkt höchster Effizienz über einen möglichst langen Zeit-
raum zu treffen. Dies erfordert bei sich änderndem Beförderungsbedarf
eine Flexibilität, die bei vollautomatisierten Systemen mit fest verbauter In-
frastruktur schwierig umzusetzen ist. Aus dieser Problemstellung heraus
entsteht die Forderung nach wandelbaren Systemen.
Wandlungsfähigkeit und Flexibilität
Der Begriff der Wandlungsfähigkeit stammt aus dem Bereich der Produkti-
onssysteme, kann aber auch gut auf Logistiksysteme angewendet werden.
Nach [Nyh10] kann ein System umso schneller und günstiger verändert
werden, je wandlungsfähiger es ist. Diese Wandlungsfähigkeit ermöglicht
eine investitionsgetriebene Anpassung sogenannter Flexibilitätskorridore,
innerhalb derer das System im Regelbetrieb auf unterschiedliche Anforde-
rungen reagieren kann. Die Anforderungen können sich auf verschiedene
Dimensionen wie z. B. Stückzahl-, Technologie- oder Produktveränderungen
beziehen.
Wie genau die Wandlungsfähigkeit eines Systems umgesetzt wird, fasst
[Lan+18, S. 9] zusammen. Es sind Eigenschaften des Systems, die sich auf
die individuellen Eigenschaften der physisch enthaltenen Objekte beziehen:
• Kompatibilität
Definierte Schnittstellen ermöglichen die aufwandsarme Integration von
Objekten oder Prozessen in das System.
• Mobilität
Objekte können sich lokal uneingeschränkt bewegen.
• Modularität
Das System und seine Objekte bestehen aus standardisierten, voll funkti-
onsfähigen Einheiten.
• Skalierbarkeit
Ein System ist auf Veränderungen der Anzahl an vorhandenen Objekten
14 2 Grundlagen
innerhalb seiner technischen, räumlichen und organisatorischen Dimen-
sionen vorbereitet.
• Universalität
Ein System kann für unterschiedliche Anforderungen verschiedener Ob-
jekttypen dimensioniert und gestaltet werden.
Nach [Lan+18] werden diese Eigenschaften für Produktionssysteme bislang
vor allem auf die physische Beschaffenheit der Objekte bezogen, während
die digitalen Aspekte noch nicht im Fokus stehen.
Beispiel Sortiersysteme
Von besonderer Bedeutung sind in dieser Arbeit die Sortiersysteme, da sie als
Anwendungsbeispiel für den Einsatz hochleistungfähiger Cyberphysischer
Zwillinge im Kapitel der Validierung betrachtet werden. Nach [Ver83] hat
die Sortierung in logistischen Systemen das Ziel, logistische Objekte nach
bestimmten Kriterien auf Zielorte zu verteilen. Ein Sortiersystem kann als
Subsystem betrachtet werden, dessen Grenzen durch Einschleusbereiche und
Ausschleusbereiche gekennzeichnet ist. Über die Einschleusbereiche wird
ein ungeordneter Objektstrom in das System eingeleitet, dessen Einzelob-
jekte individuell identifiziert werden, um anschließend zum bestimmten
Ziel transportiert zu werden. Einen guten Überblick über Sortiersysteme
im Allgemeinen geben [BJ19] und [Jt12]. Für die Leistungsberechnung kann
[Sem15] zu Rate gezogen werden.
Ein wichtiger Einsatzbereich von Sortiersystemen sind die Verteilzentren
von Kurier-, Express- und Paketdiensten (KEP). Hier finden sich Anlagen im
Hochleistungsbereich in Einsatz, die von 10.000 Paketen pro Stunde bis hin
zu 400.000 Paketen pro Stunde sortieren können (vgl. [BJ19, S. 153]).
Linie Loop
(a) (b)
Abb. 2.2 Sortertopologien nach [BJ19, S. 161]
Hochleistungssortiersysteme sind bislang eine Domäne der Stetigfördersys-
teme und werden üblicherweise anhand ihrer Topologie klassifiziert. Die
Linientopologie ist in Abbildung 2.2a dargestellt und wird unter Verwen-
dung von Platten-, Stahl- oder Plastikbändern als Tragmittel ausgeführt. Bei
der Schleifentopologie (engl. loop), die in Abbildung 2.2b dargestellt ist,
2.1 Logistik 15
werden in der Regel segmentierte Tragmittel verwendet, wie etwa beim
Kippschalensorter oder beim Quergurtsorter (vgl. [BJ19, S. 160]).
Ein dezentral gesteuertes Sortiersystem, der GridSorter, ermöglicht ei-
ne mittlere Sortierleistung von 3.000 bis 10.000 Objekten pro Stunde (vgl.
[Fle21]).
Steuerung eines logistischen Systems
Nach DIN 19233 bezeichnet der Begriff der Steuerung einen „[. . . ] Vorgang in
einem System, bei dem eine oder mehrere Größen als Eingangsgrößen ande-
re Größen als Ausgangsgrößen aufgrund der dem System eigentümlichen
Gesetzmäßigkeiten beeinflussen“ (vgl. [Deu98]).
Von außen betrachtet sind für logistische Systeme die Eingangsgrößen die
Eintrittszeitpunkte und -orte logistischer Objekte in das System sowie die
zugehörigen Zielinformationen gegeben. Die Ausgangsgrößen setzen sich
durch Austrittszeitpunkte, -orte und Verweildauern zusammen. Die dem
logistischen System eigentümlichen Gesetzmäßigkeiten sind durch seine
technischen, räumlichen und organisatorischen Bedingungen bestimmt.
Von innen betrachtet ist ein logistisches System eine Mehrebenensteue-
rung, wie sie auch aus der Regelungstechnik bekannt ist (siehe Abbildung 2.3,
vgl. [Lun10, S. 3])
Abb. 2.3Mehrebenensteuerung der Regelungstechnik nach [Lun10]
Dabei wird der Begriff des dynamischen Systems verwendet, dessen Dynamik
sich in der zeitlichen Änderung seiner wichtigsten Kenngrößen ausdrückt.
Dabei können sowohl technische Anlagen als auch Lebewesen als dyna-
mische Systeme aufgefasst werden. Ein dynamischer Prozess bezeichnet die
Veränderungen, die sich innerhalb des dynamischen Systems abspielen. Über
eine zielgerichtete Beeinflussung wird das System gesteuert (vgl. [Lun10, S.
2]).
16 2 Grundlagen
Bei der Mehrebenensteuerung, wie sie in Abbildung 2.3 gezeigt ist, un-
terscheiden sich die einzelnen Ebenen in der Art der zeitlichen Betrachtung.
Auf der untersten Ebene befinden sich die sogenannten Regler, die das dy-
namische System direkt beeinflussen. Jeder Regler i beeinflusst über eine
Stellgröße ui das dynamische System so, dass ein auf einer Führungsgröße
wi basierendes Regelziel verfolgt wird, dessen Erreichung über die Mess-
größe yi beobachtet werden kann. Dieser Regelvorgang erfolgt kontinuierlich
oder quasi-kontinuierlich, d. h. in sehr kurzen Zeitintervallen. Regler und
dynamisches System stehen in ständiger Wechselwirkung und bilden einen
geschlossenen Wirkungskreis, den sogenannten Regelkreis. Diese unterste
Ebene der Steuerung wird Regelung genannt und ist Gegenstand der Rege-
lungstechnik (vgl. [Lun10, S. 3])).
Abb. 2.4 Grundstruktur eines Regelkreises nach [Lun10, S. 4]
Ein weiterer wichtiger Begriff ist die Regelstrecke, die zur Grundstruktur
eines Regelkreises gehört (siehe Abbildung 2.4). Sie bezeichnet den Teil
des dynamischen Systems, der von einem einzelnen Regler innerhalb eines
geschlossenen Wirkungskreises kontrolliert wird. Über e(t) = w(t) − y(t)
kann die Regelabweichung bestimmt werden, in deren Abhängigkeit der
Regler unter Berücksichtigung der „eigentümlichen Gesetzmäßigkeiten“ der
Regelstrecke und einer eventuellen äußeren Störgröße d(t) die Stellgröße y(t)
beeinflussen wird.
In einem logistischen System betrifft die Regelung die lokal begrenzte
Ortsveränderung logistischer Objekte, insofern kann hier der Begriff der
Regelstrecke fast wörtlich genommen werden. In [Lun10, S. 7] wird ein lo-
gistisches Beispiel für einen manuellen Regelkreis gegeben. Dort ist der
Kranführer eines Portalkrans der Regler, der die Bewegung der Laufkatze be-
einflusst, an der ein Objekt an einem Seil hängt. Dabei ist neben der gezielten
Transportbewegung eine zusätzliche Zielvorgabe, dass das Objekt nicht in
Schwingung gebracht werden soll. Der Kranführer besitzt ein aus Erfahrung
gelerntes,mentales Modell der Regelstrecke, die aus Laufkatze, Seil und Objekt
besteht. Durch kontinuierliche Beobachtung aus seiner Kabine heraus kann
er die Transportbewegung ohne Schwingung über Änderung der Beschleuni-
gung der Laufkatze steuern. Als zusätzliche Störgröße beeinflusst der Wind
die Schwingung des Objekts.
2.1 Logistik 17
Ein Beispiel für Regelung in einem automatisierten Logistiksystem ist die
Einschleusung von Paketen auf einen Kippschalensorter (siehe Abschnitt Sor-
tiersysteme). Hier ist die Messgröße die Belegung der Kippschalen, die sich
auf die Einschleusung zubewegen. Das Regelungsziel ist die Bewegung eines
Pakets derart, dass es sicher auf einer freien Schale zu liegen kommt. Die
Regeleinrichtung besteht aus einem Computer, dessen Programm auf einem
mathematischenModell der Regelstrecke beruht undmit Sensoren und Aktoren
verbunden ist. Die Beobachtungsfähigkeit ist auf die Messung einer Licht-
schranke beschränkt, die sich vor der eigentlichen Einschleusung befindet.
Teil des Modells ist das Wissen über die Geschwindigkeit des Sortiersystems,
sodass berechnet werden kann, wann genau sich eine leere Kippschale vor
der Einschleusung befindet. Die Stellgröße ist die Bewegung eines Förderban-
des, dessen Krafteinwirkung das Paket so beschleunigt, dass es im richtigen
Moment auf die Kippschale rutscht. Teil der technischen Ausführung der
Regelstrecke sind Hilfsmittel für die Geschlossenheit des Wirkungskreises:
Mechanische Zwangsbedingungen, die über Leitplanken realisiert werden, si-
chern die Bewegung des Pakets so ab, dass es innerhalb der Regelstrecke
bleibt.
Die Besonderheit bei einem logistischen System ist, dass die elementaren
Regeleinrichtungen zueinander in räumlicher Beziehung stehen. Jeder Regler
hat Nachbarn, mit denen er im Austausch steht. Dabei kann für die Logistik
zwischen zwei Fällen unterschieden werden:
• Der Regler hat einen festen Ort und steuert lokal beschränkt die Be-
wegung logistischer Objekte in seinemWirkungsbereich.
In diesem Fall bilden die Regeleinrichtungen die Knoten und/oder Kan-
ten des logistischen Netzwerks ab. Die logistischen Objekte werden von
demWirkungsbereich des einen Reglers zumWirkungsbereich des nächs-
ten Reglers bewegt. Dieser Fall wird in der Logistik mit dem Begriff der
Stetigfördertechnik bezeichnet, der sich auf den stetigen Objektfluss be-
zieht. Ein klassisches Beispiel ist ein System aus Förderbändern.
• Der Regler bewegt sich zusammen mit einem logistischen Objekt
durch das Gesamtsystem.
Hier ist die Regeleinrichtung Teil eines logistischen Objekts, das sich
zusammen mit einem oder mehreren logistischen Objekten durch das
System bewegt. Die Knoten und Kanten des logistischen Netzes sind
hier als Straßen und Kreuzungen zu verstehen. Ein Beispiel ist ein Ga-
belstapler, der eine Palette transportiert. Dieser Fall wird in der Logistik
Unstetigfördertechnik genannt.
Die höheren Ebenen bei einer Mehrebenensteuerung der Regelungstech-
nik haben einen längeren Betrachtungszeitraum und betrachten das offene
Gesamtsystem. Dabei haben Planung und Optimierung eine koordinieren-
18 2 Grundlagen
de Funktion bezüglich der hierarchisch tieferstehenden Regler (siehe Ab-
bildung 2.3). Grundsätzlich gilt: Je höher die Hierarchieebene, desto län-
gerfristiger und komplexer werden die Steuerungsaufgaben (vgl. [Lun10,
S. 3]). Für automatisierte Logistiksysteme klassischer Bauart definiert das
VDMA-Einheitsblatt 15276 Datenschnittstellen in Materialflusssystemen ein
Steuerungsmodell, das auf Ebenen basiert (vgl. [Ver94]). Das Modell der
Regelungstechnik wird um die Bedeutung der Topologie des Systems er-
gänzt. So entsprechen die beiden untersten Ebenen Antriebe und Geber und
Elementsteuerung im Prinzip der Reglerebene, jedoch ist hier schon sprach-
lich angedeutet, dass es sich um lokal beschränkte, elementare, einander
ausschließende Wirkungsbereiche handelt. Die höheren Ebenen erweitern
die räumliche Zuständigkeit sukzessive von der Bereichssteuerung über die
Subsystemsteuerung bis hin zur Systemsteuerung.
Simulation logistischer Systeme
Nach [Ver10] wird unter dem Begriff der Simulation allgemein „[. . . ] ein
Verfahren zur Nachbildung eines Systems mit seinen dynamischen Prozessen
in einem experimentierbaren Modell, um zu Erkenntnissen zu gelangen, die
auf die Wirklichkeit übertragbar sind“ verstanden. Dabei werden „Prozesse
(Zustandsfolgen in der Zeit) endogen aufgrund der im Modell dargestellten
Wirkzusammenhänge und Zeitmechanismen entwickelt“ (vgl. [SK90, S. 437]).
Eine ausführliche Betrachtung der klassischen Simulation logistischer Sys-
teme findet sich in [Wen18]. Ein Anwendungsbeispiel ist der Einsatz während
der Planungphase mit dem Ziel, einen Sicherheitsgewinn, Lösungsverbes-
serungen und ganz allgemein ein Systemverständnis zu gewinnen, so dass
insgesamt ein günstigerer Anlagenbetrieb ermöglicht wird. Die Simulation
kann quantifizierbare Charakteristiken verschiedener Lösungsvarianten für
ein System liefern und somit die Entscheidungsfindung bei der Planung
unterstützen. Im Gegensatz zu mathematisch-analytischen Methoden hat
die Simulation den methodischen Vorteil, dass nahezu beliebig komplexe
Sachzusammenhänge über die schrittweise Entwicklung von Zustandsfolgen
über die Zeit abgebildet werden können (vgl. [Wen18, S. 4ff]).
Zeitmechanismen
Ein wichtiges Unterscheidungsmerkmal bei Simulationsmethoden sind die
verwendeten Zeitmechanismen. Die Abbildung des Zeitverlaufs innerhalb
der Simulation geschieht über eine sogenannte Simulationsuhr und wird
Simulationszeit genannt. Wenn die Simulation rechnergestützt über ein Simu-
lationsprogramm durchgeführt wird, dann kann diese Simulationsuhr durch
verschiedene Mechanismen gesteuert werden.
Bei einer Simulation mit kontinuierlichem Zeitverhalten wird das Systemver-
halten durch eine Menge gekoppelter Differenzialgleichungen beschrieben,
2.2 Cyberphysische Systeme 19
sodass die abhängigen Variablen in einem stetigen Verlauf über die Zeit
abgebildet werden (vgl. [Wen18, S. 10ff]).
Im Gegensatz dazu stehen zeitdiskrete Methoden, bei denen die Simula-
tionsuhr von Zeitpunkt zu Zeitpunkt springt. Dies geschieht bei der ereig-
nisdiskreten Simulation auf Basis von Ereignissen, deren Eintrittszeitpunkte
vorberechnet und in einer zentralen Ereignisliste sortiert werden, sodass
bei Ablauf der Simulation die korrekte Vorher-Nacher-Beziehung zwischen
Ereignissen eingehalten wird.
Im Rahmen dieser Arbeit hat ein weiterer möglicher Zeitmechanismus eine
wichtige Bedeutung: Bei der quasikontinuierlichen Simulation erfolgt der Zeit-
fortschritt diskret in kurzen, vorher festgelegten Zeitintervallen. Je kleiner
das Zeitintervall festgelegt wird, desto näher ergibt sich eine Abbildung der
kontinuierlichen Simulation. Während die meisten am Markt verfügbaren
Materialflusssimulatoren den Zeitmechanismus der diskreten ereignisori-
entierten Simulation verwenden, basieren Simulatoren für geschlossene Re-
gelkreise häufig auf quasikontinuierlichen Abbildungen des Zeitfortschritts
(vgl. [Dan14, S. 33]).
2.2 Cyberphysische Systeme
Cyberphysische Systeme (CPS) sind Systeme, die sowohl aus Rechen- und
Kommunikationseinheiten als auch aus physischen Komponenten bestehen.
Ein CPS besteht aus einer Sammlung von Computersystemen, die mitein-
ander kommunizieren und über Sensoren und Aktoren in einem rückge-
koppelten Regelkreis mit der physischen Welt interagieren (vgl. [Alu15]).
Sie kombinieren daher Rechen- und Kommunikationsfunktionen mit der
Überwachung und Steuerung von Anlagen im physischen Bereich.
Eine Entität im CPS besteht aus mehreren Komponenten, die wie folgt
klassifiziert werden können: die steuernde Cyberkomponente, die physische
Komponente und der Kommunikationskanal zwischen beiden. Die Cyber-
komponente besteht aus Hardware, Software und einer Datenschnittstelle,
die mit einemNetzwerk und häufigmit der Internet-Infrastruktur verbunden
ist. Zu den physischen Komponenten gehören Sensoren und Aktoren. Die
Kommunikationskanäle dienen der Übertragung von Daten aus der physi-
schen Umgebung des CPS an die Cyberkomponente und von Befehlen von
der Cyberkomponente an die Sensoren und Aktoren (vgl. [NWW21]).
Da es sich um Echtzeitsysteme handelt, haben einige dieser Systeme stren-
ge Anforderungen an die Dienstgüte (Qualtiy of Service, QoS). Aus diesem
Grund werden CPS manchmal auch als sicherheitskritische Systeme bezeich-
net. Die in der Literatur häufig erwähnten Anwendungen von CPS erstrecken
sich über mehrere Bereiche, darunter z. B. Kraftwerke, Strom- und Wasser-
versorgung, Verkehrssysteme sowie Systeme im Öl- und Gassektor (vgl.
[NWW21]).
20 2 Grundlagen
CPS können sowohl auf synchrone als auch auf asynchrone Weise für
gleichzeitige Berechnungen modelliert werden, sie können in kontinuier-
licher Zeit für dynamische Systeme modelliert werden, oder sie können
diskrete und kontinuierliche Zeitmodelle als Hybridsysteme kombinieren
(vgl. [Alu15]).
CPS als wissenschaftliches Thema stützt sich auf eine Vielzahl von Teil-
disziplinen, darunter modellbasierter Entwurf, Nebenläufigkeitstheorie, ver-
teilte Algorithmen, formale Methoden der Spezifikation und Verifikation,
Kontrolltheorie, Echtzeitsysteme und hybride Systeme. Zu den Themen
gehören Sicherheits- und Liveness-Anforderungen, temporale Logik, Mo-
dellprüfung, deduktive Verifikation, Stabilitätsanalyse linearer Systeme und
Echtzeit-Scheduling-Algorithmen. Repräsentative Entwurfsprobleme stam-
men aus den Bereichen verteilte Algorithmen, Netzwerkprotokolle, Steue-
rungsentwurf und Robotik (vgl. [Alu15]).
CPS als verteilte Systeme mit gemeinsamem Informationsraum
Ein CPS kann als verteiltes System mit vielen Entitäten konzeptioniert wer-
den. In diesem Fall besteht die Rolle der Cyberkomponente einer Entität
zusätzlich darin, dass sie eine Koordination mit anderen Entitäten durch-
führt. Der Fokus liegt auf der Schaffung eines gemeinsamen Informations-
raums, der als Basis für die Koordination dient. Die technische Umsetzung
des Informationsraums kann auf verschiedene Arten, zentral oder dezentral,
ausgeführt sein. In der vollständig dezentralen Ausführung ist der Informa-
tionsraum virtuell über alle Entitäten des CPS verteilt und die Koordination
wird dementsprechend dezentral durchgeführt.
Verteilte CPS in Transportsystemen
In der Logistik besteht ein CPS aus intelligenten Logistikobjekten, die über
eine eigene Cyberkomponente verfügen. Die Transportaufgabe wird gelöst,
indem die Bewegungen der Objekte durch eine dezentrale Koordination
unter den Entitäten des CPS abgestimmt werden. Bei dieser Abstimmung ist
die Fragestellung nach der zeitabhängigen Belegung des Raums durch die
Logistikobjekte zu klären, sodass ein konfliktfreier Transport vieler Objekte
möglich ist. Dies erfordert ein gemeinsam akzeptiertes Abbild des physischen
Raums und einen Mechanismus, der jeden Konfliktfall eindeutig löst.
Dezentrale Koordination und Konsens
Die Grundlage jeder dezentralen Koordination von Entitäten in verteilten
CPS bildet das gezielte Zusammenführen und Verteilen von notwendigen
Informationen. Damit ein CPS ein konsistentes Gesamtverhalten zeigt, be-
nötigt es ein Verfahren um sicherzustellen, dass alle Entitäten, die an einer
Entscheidungssituation beteiligt sind, ihre indviduellen Entscheidungen aus
derselben Wissensbasis ableiten. Mit dem Begriff des Konsenswird bei verteil-
2.2 Cyberphysische Systeme 21
ten Systemen ein grundlegender Systemzustand bezeichnet, bei dem sich alle
betroffenen Enitäten auf eine gemeinsame Informationsbasis geeinigt haben
(vgl. [Bod+20]). Diese gemeinsame Basis kann als Informationsraum bezeich-
net werden. Es gibt zwei Hauptfehler, die bei der dezentralen Koordination
auftreten können:
• Absturz
Dieser Fehler kann aufgrund von Hardware- und Softwareschäden an
einer Entität auftreten. Ein Konsensverfahren sollte robust genug sein,
um abgestürzte Knoten unabhängig zu behandeln und zu reparieren,
ohne den Betrieb anderer Knoten zu beeinträchtigen.
• Byzantinische Fehler
Ein byzantinischer Fehler wird durch eine böswillige Entität erzeugt, die
absichtlich gefälschte Nachrichten weiterleitet, um das normale Funktio-
nieren des CPS zu stören. Ein Konsensverfahren sollte in der Lage sein,
byzantinische Entitäten im Netz zu erkennen und unter Quarantäne zu
stellen.
In Bezug auf diese Arbeit ist insbesondere die Robustheit gegenüber Abstür-
zen, die im Fall einer zentralen Entscheidungsinstanz einen vollständigen
Ausfall des Systems bewirken, von Bedeutung. Dazu ist ein autonomes Ver-
halten zur Verhinderung eines führungslosen Systemzustands notwendig.
Zusätzlich ermöglicht die erfolgreiche Umsetzung einer solchen autonomen
Selbstkonfiguration der Führungsrolle bei verteilten Entitäten eine automati-
sierte Skalierbarkeit und eine aufwandsarme Inbetriebnahme.
Vollständig dezentrale Anführerwahl
An einem klassischen Verfahren der vollständig dezentralen Koordination
soll eine Fähigkeit demonstriert werden, mit der autonom eine temporär
zentrale Führungsentität bestimmt werden kann. Mit der Methode lässt sich
eine Robustheit gegenüber Abstürzen erreichen. Gleichzeitig stellt sie eine
Möglichkeit dar, die in bestimmten Fällen notwendige zentrale Koordination
innerhalb eines dezentral verteilten Systems bereitzustellen. Das Ziel des
Verfahrens ist die Wahl einer Führungsentität. Sollte die Entität abstürzen
oder von einem Teil des Netzwerks getrennt werden, können die Entitäten
im führungslosen Teil des Netzwerks autonom eine neue Führungsinstanz
wählen.
Das Verfahren der Anführerwahl (engl. leader election) beschreibt ein Kon-
sensverfahren, bei dem vollständig dezentral eine Entität bestimmt wird, die
von allen anderen als führend akzeptiert wird. In [Alu15, S. 60ff] wird ein
Lösungsalgorithmus für synchrone Netzwerke beschrieben, der durch das
Fluten von Nachrichten zwischen den Entitäten diejenige mit der höchsten
Identitätsnummer als Anführer bestimmt. Damit die Suche nach der höchsten
22 2 Grundlagen
Nummer sicher nach einer endlichen Anzahl von synchronen Übetragungs-
runden beendet werden kann, muss die maximale Anzahl an Elementen im
Netzwerk bekannt sein. Für den asynchronen Fall wird in [Alu15, S. 163ff]
ein Algorithmus beschrieben, der ohne explizite Kommunikationsrunden
auskommt und weniger Nachrichten verschickt.
Das Verfahren der Anführerwahl ist von besonderer Bedeutung in de-
zentralen CPS, da es die Vorteile der Robustheit gegenüber Abstürzen mit
der Effizienz einer zentralen Steuerung verbindet. Diese Vorgehensweise
bietet sich für zeitkritische Anwendungen an, bei denen eine vorhersehbare
Reaktionszeit erforderlich ist.
Echtzeitfähigkeit in CPS mit Transportaufgaben
Der Begriff der Echtzeitfähigkeit beschreibt die Eigenschaft eines Systems,
das auf äußere Ereignisse in vorbestimmter Zeit reagieren kann. In ein-
zelnen Computersystemen wird diese Fähigkeit durch das Verhalten von
Algorithmen bestimmt, die unter den Beschränkungen der Hardware des
Laufzeitsystems in vorbestimmter Zeit ein Ergebnis liefern (vgl. [But11]). In
verteilten Systemen, in denen die Reaktion von einer Abstimmung unter
den betroffenen Entitäten abhängt, wird die Echtzeitfähigkeit zusätzlich vom
Kommunikationssystem und den Übetragungsprotokollen beeinflusst.
Im Fall von Transportsystemen besteht die Systemreaktion aus zwei Kom-
ponenten: der Bewegungsplanung und ihrer Ausführung im physischen
Raum. Je nach Verfahren handelt es sich bei dem übergeordneten Prozess
um eine alternierende Sequenz von Teilplanungsprozessen und physischen
Teilbewegungen. Ein vollständig echtzeitfähiges Transportsystem garantiert
eine vorbestimmte Ankunftszeit für einen Auftrag. Die Herausforderung ist
die Abstimmung der Bewegung zwischen vielen gleichzeitigen Aufträgen.
Wenn ein Transportsystem als CPS ausgelegt ist, wird diese Abstimmung
dezentral koordiniert. Damit hängt die Echtzeitfähigkeit von einem Konsens-
verfahren ab, dessen Informationsraum eine allgemein akzeptierte dynami-
sche Belegung des Raums repräsentiert.
2.3 Digitaler Zwilling
Das Konzept des Digitalen Zwillings ist eng verwandt mit dem des CPS.
Auch hier stehen drei grundlegende Konzepte im Mittelpunkt: das phy-
sische Objekt, das virtuelle Objekt und die Datenschnittstelle dazwischen.
Hinzu kommt der Wunsch, eine Ununterscheidbarkeit zwischen physischer
und virtueller Welt herzustellen, also eine dauerhafte Zwillingseigenschaft
der Objekte durch Datenaustausch zu gewährleisten. Eine abstrahierte und
gleichzeitig relevante Abbildung des einzelnen Verhaltens aller physischen
Objekte deckt sich mit der Absicht der Simulation, die technischen Vorteile
einer virtuellen Welt für die Verbesserung der physischen Welt einzusetzen.
2.3 Digitaler Zwilling 23
Hinter dem virtuellen Objekt eines Digitalen Zwillings steht ein datenge-
triebenes Modell, das durch ein axiomatisches System der Anwendungsdo-
mäne definiert ist. Die abstrahierten Eigenschaften der physischen Entität
werden über die Datenschnittstelle und durch die sprachlichen Begriffe der
Axiomatik in Relation gesetzt. Die Semantik eines Digitalen Zwillings liegt
zum einen in der intrinsischen Bedeutung der Axiome, mit denen die defi-
nierten Begriffe zueinander in Beziehung gesetzt werden, und zum anderen
in der Interpretation des Metamodells der Daten, die über Sensoren bereitge-
stellt werden.
Hauptaufgabe des Digitalen Zwillings
Die Hauptaufgabe des Digitalen Zwillings ist der automatisierte Ab-
gleich des Zustands eines physischen Objekts mit seinem virtuellen
Abbild. Der Abgleich der Zustände muss eine Qualität erreichen, die
eine Anwendung der Ergebnisse von Experimenten am virtuellen Ob-
jekt auf das physische Objekt direkt und automatisiert ermöglichen.
Aus der Bedingung des automatisierten gegenseitigen Abgleichs der Zu-
stände folgt, dass ein Digitaler Zwilling zwei Computersysteme beinhaltet.
Das erste System ist im physischen Objekt eingebettet und bildet ein CPS.
Es besitzt ein oder mehrere technische Verfahren zur Beobachtung sowie
die Fähigkeit zur Kommunikation. Auf dem zweiten Computersystem wird
das virtuelle Objekt als digitales Abbild des physischen Objekts ausgeführt.
Das eingebettete Computersystem wird als ressourcenbeschränkt angenom-
men, während das Computerystem, in dem das virtuelle Objekt läuft, ohne
Beschränkungen gedacht ist.
In Abbildung 2.5 ist der Aufbau eines Digitalen Zwillings skizziert. Auf
der linken Seite ist das physische Objekt als Entität in einem verteilten CPS
abgebildet. Auf der rechten Seite ist das laufend aktualisierte virtuelle Abbild
dargestellt (a), aus dem für die Durchführung von Experimenten eine Kopie
erstellt wird (b). Die Trennung zwischen Abbild und Kopie ist notwendig,
da alle Änderungen am Abbild direkt zu Änderungen am physischen Objekt
führen.
Durch den vollständigen Wegfall der manuellen Datenübertragung wird
insbesondere die Gestaltung des Datenempfangs am physischen Objekt rele-
vant. Für das physische Objekt in einem Digitalen Zwilling gelten folgende
Bedingungen:
• Daten des virtuellen Objekts müssen am physischen Objekt automatisiert
empfangen und verarbeitet werden können. Es ist immer ein CPS oder
eine Entität in einem verteilten CPS.
24 2 Grundlagen
Abb. 2.5 Grundstruktur des Digitalen Zwillings
• Ein physisches Objekt kann nur dann Teil eines Digitalen Zwillings sein,
wenn es durch einen technischen Apparat oder ein Verfahren als trennba-
res Einzelstück erkennbar ist.
• Das erkannte physische Objekt muss eindeutig identifizierbar sein, damit
die Daten dem richtigen virtuellen Zielobjekt zugeordnet werden können.
Digitale Zwillinge können in ihrer Größe und Komplexität sehr unterschied-
lich sein, das ist im Prinzip durch die sehr allgemein gefasste Metapher
vorgegeben. Einen guten Überblick über mögliche Anwendungsfälle gibt
[Kri+18].
Digitale Zwillinge in der Logistik
Die Synchronisierung von Material- und Informationsfluss ist eine der Auf-
gaben eines logistischen Systems und legt eine Anwendung des Konzepts
des Digitalen Zwillings nahe. Dazu kommt, dass die Bedingung der Identifi-
zierbarkeit für physische Objekte in der Logistik vorausgesetzt wird. Jedes
physische Objekt wird im Rahmen von Logistikprozessen eindeutig identi-
fizierbar gemacht. Dabei kann es als Einzelstück getrennt von anderen Ob-
jekten behandelt und über die Verwendung von identifizierbaren Behältern,
Ladehilfsmitteln oder Verpackungen mit anderen Objekten zusammenge-
fasst werden. Der Digitale Zwilling ist in diesem Sinne eine konsequente
Weiterentwicklung der allgemeinen Digitalisierung logistischer Prozesse.
Ganz allgemein gilt: Immer dann, wenn ein physisches Objekt koordiniert
bewegt wird, handelt es sich um einen logistischen Prozess. Dieser Umstand
macht die Logistik zu einer Kernanwendung des Digitalen Zwillings.
Digitale Zwillinge mit kontinuierlicher Wahrnehmunsgfähigkeit
Digitale Zwillinge lassen sich im Weiteren durch ihre Wahrnehmungsfä-
higkeit bezüglich der Innen- und der Außenwelt unterscheiden. In Abbil-
2.3 Digitaler Zwilling 25
dung 2.6 werden Digitale Zwillinge in verschiedenen Skalierungen darge-
stellt, die ihren Innenraum beobachten. In Abbildung 2.6a ist dies ein größerer
Raum, wie etwa eine Halle, die Menschen und physische Objekte enthält.
Abb. 2.6 Digitaler Zwilling und Räume in verschiedenen Skalierungen
In Abbildung 2.6b beobachtet ein Behälter seinen Innenraum. In beiden Fäl-
len führt die Beobachtung von Veränderungen im Innenraum des physischen
Objekts zu einer Erzeugung von Veränderungsereignissen in der virtuel-
len Welt. Die Objekte (oder Menschen) sind in diesem Fall keine Digitalen
Zwillinge, sondern Teil des übergeordneten Systemzustands.
Abb. 2.7 Digitaler Zwilling eines Roboters
In Abbildung 2.7 wird ein mobiler Roboter als Digitaler Zwilling dargestellt,
der seine äußere Umgebung beobachtet. Er verändert aufgrund dieser Be-
obachtungen seinen inneren Zustand, der zum virtuellen Objekt übertragen
wird.
26 2 Grundlagen
2.4 Planung und Verwaltung von
Objektbewegungen
Der Kern dieser Arbeit befasst sich mit der Planung und Verwaltung von
Objektbewegungen in der Logistik. Dazu werden die theoretischen Grund-
lagen der Bewegungsplanung aus der Robotik betrachtet, insbesondere das
Konzept des Konfigurationsraums für diskrete und kontinuierliche Weltmo-
delle. Ein besonderer Fokus liegt auf den Grundlagen und dem Stand der
Forschung für die Bewegungsplanung in Multi-Robotersystemen, da diese
für logistische Anwendungen von besonderer Bedeutung sind.
Konflikte bei der Bewegung mehrerer Objekte
Konflikte bei der Bewegung zwischen physischen Objekten werden in der
Robotik und bei Fahrerlosen Transportsystemen seit langem untersucht (vgl.
[JY94]). Sie können immer dann entstehen, wenn gezielte Bewegungen meh-
rerer Objekte koordiniert werden müssen.
Kollisionen
Kollisionen sind der grundlegende Konflikttyp bei der Bewegung mehrerer
Objekte, dessen Auflösung durch Vermeidung ursächlich für alle anderen
Konflikttypen ist. Kollisionen können immer dann entstehen, wenn sich
zwei Objekte zur gleichen Zeit in den gleichen Ort hineinbewegen. Dabei
lassen sich punktuelle Kollisionen, wie sie in Abbildung 2.8 dargestellt sind,
identifizieren, die sich durch einen örtlich begrenzten Kollisionsbereich aus-
zeichnen. Dies kann der Kreuzungspunkt zweier Bahnkurven sein (siehe
Abbildung 2.8a) oder ein Berührungspunkt der Hüllkurven zweier Objekte
(siehe Abbildung 2.8b).
t‘ t‘
t‘
(a) (b)
Abb. 2.8 (a) Kollision durch sich kreuzende Bahnkurven (b) Kollision durch
Hüllkurvenüberlappung
Neben punktuellen Kollisionen, die sich auf einen begrenzten Ort beschrän-
ken, sind kinematisch bedingte Frontalkollisionen (siehe Abbildung 2.9a)
und kinodynamisch bedingte Heckkollisionen (siehe Abbildung 2.9b) zu
2.4 Planung und Verwaltung von Objektbewegungen 27
unterscheiden. Bei Frontalkollisionen kommt es ohne Richtungsänderung
zwingend zu einer Kollision, solange sich mindestens ein Objekt weiterbe-
wegt. Zu einer Heckkollision kommt es nur dann, wenn Geschwindigkeits-
oder Beschleunigungswerte nicht nicht rechtzeitig angeglichen werden.
(a) (b)
Abb. 2.9 (a) Frontalkollision und (b) Heckkollision
Die in Abbildung 2.8 und Abbildung 2.9 dargestellten Situationen sind ar-
chetypische Beispiele, die in beliebiger Reihenfolge kombiniert und verkettet
werden können. Insbesondere in Situationen, wo sich mehr als zwei Objekte
auf begrenztem Raum bewegen, kann das Vermeiden einer ersten Kollision
zur nächsten Kollisionsmöglichkeit führen.
Eine Kollision kann im Allgemeinen durch Geschwindigkeitsänderungen
vermieden werden, also Beschleunigungs- oder Bremsmanöver, durch War-
ten im Stillstand oder durch eine Richtungsänderung bzw. ein Ausweichma-
növer. Eine Ausnahme bildet die Frontalkollision, die immer ein Ausweichen
erfordert. Die Maßnahmen zur Vermeidung von Kollisionen können beliebig
kombiniert und verkettet werden.
Stau
Stau entsteht immer dann, wenn Kollisionen durch Warten im Stillstand
vermieden werden. Es kann zwischen prozessbedingten Staus und koordinati-
onsbedingten Staus unterschieden werden. Die prozessbedingten Wartezeiten
entstehen durch den Zwang mehrerer Objekte, einen spezifischen Ort zu
besuchen. Wenn innerhalb eines Zeitraums die Anzahl der Ankünfte größer
ist als die Anzahl der Abfertigungen, dann entstehen Wartezeiten und damit
Stau. Im Gegensatz dazu entstehen koordinationsbedingte Staus aus Wartezu-
ständen, die rein durch die Bewegungskoordination verursacht werden. Ein
Beispiel hierfür ist in Abbildung 2.10 dargestellt. Es entsteht Stau an einer
Zusammenführung der Bahnkurven, obwohl mit den gestrichelten Linien
mögliche freie Bewegungsmöglichkeiten aufgezeigt sind.
Durch Stau entstehen physische Warteschlangen im logistischen Raum, die
als kinematische Hindernisse auf nicht am Stau direkt beteiligte Objekte
28 2 Grundlagen
Abb. 2.10 Staubildung durch Warten im Stillstand
wirken. Staueffekte können sich so im Raum ausbreiten, indem immer mehr
Objekte warten müssen.
Livelocks und Deadlocks
Eine besondere Form des Konflikts kann entstehen, wenn die Engstelle oder
Ressource, auf die gewartet wird, aufgrund spezifischer Regeln der Bewe-
gungskoordination niemals freigegeben wird.
Zu diesen Fällen gehören sogenannte Livelocks, bei denen ein Objekt
unendlich lange wartet, da der zu erreichende Ort durch eine unendliche
Kette von höher priorisierten Objekten blockiert wird (siehe Abbildung 2.11).
Abb. 2.11 Entstehung eines Livelocks durch unendlich langes Warten auf eine unendlich
große Zahl von höher priorisierten Objekten
Eine weitere Art eines solchen Konflikttyps bilden Deadlocks, bei denen
durch spezifische Regeln der Bewegungskoordination eine zirkuläre War-
tebeziehung entstanden ist. Ein lokaler Deadlock ist in Abbildung 2.12 ab-
gebildet. Er ähnelt der Situation im Straßenverkehr, wo an einer einfachen
Kreuzung von allen vier Seiten gleichzeitig Verkehrsteilnehmer ankommen.
Hier greift die Rechts-vor-Links-Regelung nicht mehr, da sie zu einer zir-
kulären Wartebeziehung führt. Es bedarf einer gesonderten Auflösung des
lokalen Deadlocks (üblicherweise durch gezielte zusätzliche Kommunikation
unter den Teilnehmern).
Während lokale Deadlocks relativ intuitiv zu erkennen sind, ist die Situation
bei nichtlokalen Deadlocks beliebig komplex. Hier entstehen die zirkulären
Wartebeziehungen zum Beispiel wie in Abbildung 2.13 dargestellt durch
ungünstig liegende Warteschlangen.
2.4 Planung und Verwaltung von Objektbewegungen 29
Abb. 2.12 Entstehung eines lokalen Deadlocks
Abb. 2.13 Entstehung eines nichtlokalen Deadlocks
Livelocks und Deadlocks entstehen durch unvollständig definierte Regeln
der Bewegungskoordination, insbesondere sind reaktive bzw. lokal entschei-
dende Verfahren anfällig, da hier notwendiges globales Wissen fehlt.
Über den Begriff der Schwarmintelligenz
Der Begriff der Schwarmintelligenz ist in den vergangenen Jahren auf vielfäl-
tige Weise in der Wissenschaft verwendet worden (vgl. [Sun+20], [Yan+17],
[NXZ20]). Grundsätzlich lässt sich mit dem Begriff die Übernahme biologi-
scher Prinzipien anhand des Verhaltens von Tieren in die Gestaltung von
Algorithmen beschreiben. Dabei werden bestimmte Schwarmverhaltenswei-
sen aus der Natur, wie etwa Vogelschwärme, als Ausgangspunkt verwendet.
Schwarmintelligenz kann als Simulation sozialer Verhaltensweisen interpre-
tiert werden, wobei dem kooperativen Aspekt, im Gegensatz zu Methoden
der simulierten Evolution, eine besondere Bedeutung zukommt.
Am Ausgangspunkt der wissenschaftlichen Betrachtung von Schwarmin-
telligenz stehen Arbeiten über die Simulation von Vogelschwärmen, die zu
der Erkenntnis kommen, dass durch lokale Beobachtung von Flugnachbarn
und durch die Anwendung einfacher Regeln zur Bestimmung der Flugrich-
tung und -geschwindigkeit einzelner Vögel das komplexe Verhalten eines
30 2 Grundlagen
gesamten Vogelschwarms nachgebildet werden kann (vgl. [Rey87]).
Optimierung In abstrahierter Form wird die simulierte Bewegung von Or-
ganismen als Basis für die Partikelschwarmoptimierung verwendet (engl.
particle swarm optimization, PSO), die eine Methode für die Optimierung
kontinuierlicher, nichtlinearer Funktionen darstellt (vgl. [KE95]). Als Optimie-
rungsmethode existiert Schwarmintelligenz als eine von vielen Heuristiken,
um klassische Problemstellungen zu lösen, sodass die biologischen und so-
zialen Methaphern in den Hintergrund rücken. Hier ist die Position eines
Partikels als Teil einer Lösungsinstanz im n-dimensionalen Suchraum de-
finiert und die Geschwindigkeit als Veränderungsrate dieser Position pro
Iterationsschritt des Optimierungsalgorithmus anzusehen (vgl. [Ban19]).
Lokale Kollisionsvermeidung Aus Sicht der Robotik kann Schwarmintel-
ligenz als Teil eines Steuerungsverfahrens für Multi-Robotersysteme ver-
standen werden. Dabei ist die lokale Kollisionsvermeidung von einer globalen
Bewegungsplanung zu unterscheiden, da der Weg zum Zielpunkt nicht voll-
ständig geplant wird, sondern jeder einzelne Roboter eine individuelle Regel-
einrichtung darstellt, für die in kurzen Zyklen der Geschwindigkeitsvektor
angepasst wird. Über Sensoren nimmt jeder Roboter laufend die Nachbar-
schaftsumgebung wahr und bestimmt den eigenen Geschwindigkeitsvektor
unter Berücksichtigung der Anwesenheit und der Geschwindigkeitsvektoren
anderer Roboter. Ein wichtiges Merkmal dieser Art der Schwarmsteuerung
ist das Prinzip der Reziprozität, bei der alle Roboter dieselben Regeln ver-
wenden und somit jeder einzelne Roboter das zukünftige Verhalten anderer
Roboter vorhersagen kann. Auf diesem Prinzip basiert das Konzept der
Reciprocal Velocity Obstacles (RVO) (vgl. [Guy+09]). Eine Weiterentwicklung
des Konzepts der RVO sind die sogenannten ORCA Lines, für die gezeigt
wurde, dass eine optimale Schwarmsteuerung ohne Kollisionen erreichbar
ist (vgl. [van+11b]). Dabei wird von einem holonomischen Bewegungsmo-
dell ausgegangen und es werden keine differenziellen Zwangsbedingungen
berücksichtigt. Die Garantie der Kollisionsfreiheit kann daher in bestimmten
Situationen zu sehr hohen Geschwindigkeits- und Beschleunigungswerten
führen.
Im Rahmen dieser Arbeit wird der Begriff der Schwarmintelligenz vor
allem in Bezug auf die logistische Bewegungsplanung, daher eher in der
zur Robotik neigenden Interpretation, betrachtet. Die soziale Methapher
kann jedoch gerade bei der Mensch-Maschine-Interaktion wieder in den
Vordergrund treten (vgl. Social Networked Industry). Bei der Betrachtung
der Leistung des logistischen Systems ist die Sichtweise von Seiten der Opti-
mierung von Interesse, da hier insbesondere die Abwägung zwischen der
effizienten Zielerreichung des Individuums und der Gesamtsystemleistung
besonderer Aufmerksamkeit bedarf.
2.4 Planung und Verwaltung von Objektbewegungen 31
2.4.1 Grundlagen der Bewegungsplanung
Der Großteil der Grundlagen der Bewegungsplanung wird in dieser Arbeit
auf Basis des Standardwerks „Planning Algorithms“ von Steve M. LaValle
eingeführt (vgl. [LaV06]). Dabei wird das Hauptaugenmerk auf die theoreti-
schen Grundlagen gelegt, die unabhängig von der technischen Ausführung
eines Roboters gelten. Das Ziel dieser Grundlagenbetrachtung ist eine Über-
tragung auf allgemeine logistische Systeme, so dass einige Begriffe geändert
werden, um den veränderten Fokus zu unterstreichen:
• Der Begriff des Roboterswird durch das allgemeinere bewegte Objekt er-
setzt. Dies soll eine Erweiterung der Perspektive auf die Übertragung
in die Logistik unterstützen, da der Begriff des Roboters im Allgemein-
gebrauch auf konkrete Ausführungen von Robotern in der Logistik be-
schränkt ist (z. B. Greifarm-Roboter, Fahrerlose Transportsysteme usw.)
• Mit der gleichen Motivation wird der FachbegriffMotion Planning durch
die deutsche Übersetzung Bewegungsplanung ersetzt, sodass die Verall-
gemeinerung der Robotik-Grundlagen auf physische Objekte sprachlich
unterstützt wird.
• In den formalen Beschreibungen wird die Variable X für den Zustands-
raum durch die Variable Z ersetzt. Zum einen liegt dies näher am deut-
schen Begriff des Zustandsraums, zum anderen kann so ein Konflikt
mit der Bezeichnung der Koordinate x vermieden werden, die häufig
verwendet wird.
Zustandsraum Planungsprobleme umfassen einen Zustandsraum, der alle
möglichen Situationen erfasst, die auftreten können. Der Zustandsraum kann
z. B. die Position und Orientierung eines Roboters darstellen. Es können so-
wohl diskrete (endliche oder abzählbar unendliche) als auch kontinuierliche
(nicht abzählbar unendliche) Zustandsräume auftreten. Der Zustandsraum
wird in der Regel implizit durch einen Planungsalgorithmus dargestellt. In
den meisten Anwendungen ist die Größe des Zustandsraums (in Bezug auf
die Anzahl der Zustände oder die kombinatorische Komplexität) viel zu
groß, um explizit dargestellt zu werden.
ZeitAlle Planungsprobleme sind ihrer Natur nach dynamisch. Sie beinhalten
eine Abfolge von Entscheidungen, die im Laufe der Zeit getroffen werden
müssen. Die Zeit kann explizit modelliert werden, wie im Fall eines Transpor-
troboters, dessen Geschwindigkeit und Richtung während seiner Bewegung
geplant wird. Die Zeit kann aber auch implizit sein, indem sie einfach die
Tatsache widerspiegelt, dass die Aktionen nacheinander erfolgen müssen (lo-
gische Zeit). Der genaue Zeitpunkt einer Aktion ist unwichtig, aber die richti-
ge Reihenfolge muss eingehalten werden. Wie im Falle von Zustandsräumen
32 2 Grundlagen
kann die Zeit entweder diskret oder kontinuierlich dargestellt werden.
Aktionen Ein Plan legt Aktionen fest, die den Zustand verändern. Es muss
angegeben werden, wie sich der Zustand ändert, wenn die Aktionen aus-
geführt werden. Dies kann als zustandsbewertete Funktion für den Fall
diskreter Zeit oder als gewöhnliche Differenzialgleichung für kontinuierliche
Zeit ausgedrückt werden. Eine explizite Bezugnahme auf die Zeit wird ver-
mieden, wenn direkt ein Pfad durch einen kontinuierlichen Zustandsraum
generiert wird.
Ausgangs- und Zielzustand Die Lösung eines Planungsproblems beginnt
in der Regel in einem bestimmten Ausgangszustand und endet in einem
bestimmten Zielzustand (oder einem beliebigen Zustand aus einer Menge
von Zielzuständen). Die Aktionen eines Plans werden ausgewählt, um dieses
Ziel zu erreichen.
Planungskriterium Das Kriterium definiert das gewünschte Ergebnis eines
Plans in Bezug auf den Zielzustand und die durchgeführten Aktionen. Übli-
cherweise werden zwei Kriterien unterschieden:
• Durchführbarkeit Ein Plan ist durchführbar, wenn er unabhängig von
seiner Effizienz zum Erreichen eines Zielzustands führt.
• Optimalität Ein Plan ist optimal, wenn er durchführbar ist und zusätzlich
eine spezifizierte Leistung optimiert (z. B. kürzester Weg, schnellster
Transport) und darüber hinaus einen Zielzustand herbeiführt.
Bei vielen Bewegungsplanungsproblemen kann das Erreichen der Durch-
führbarkeit eine große Herausforderung sein. Das Erreichen der Optimalität
ist bei den meisten Problemen sehr viel schwieriger. LaValle zufolge konzen-
triert sich der Großteil der Literatur in der Robotik, der Steuerungstheorie
und verwandten Bereichen auf die Optimalität, die jedoch für viele Probleme
nicht unbedingt wichtig ist. In der Tat ist es bei vielen Anwendungen, wie
z. B. in der Logistik, schwierig, das richtige Kriterium für die Optimierung zu
bestimmen. Selbst wenn ein wünschenswertes Kriterium formuliert werden
kann, ist es möglicherweise unmöglich, einen praktischen Algorithmus zu
entwickeln, der optimale Pläne berechnet. In solchen Fällen sind praktische
Lösungen auf jeden Fall besser, als gar keine Lösungen zu haben (vgl. [LaV06]
S. 18).
Plan Im Allgemeinen ist ein Plan ein Algorithmus, der einem Entscheidungs-
träger eine bestimmte Strategie oder ein bestimmtes Verhalten vorschreibt.
Im einfachsten Fall kann ein Plan eine Abfolge von Handlungen vorschrei-
ben, die zum Erreichen des Zielzustands führen.
2.4 Planung und Verwaltung von Objektbewegungen 33
Bewegungsplaner Ein Bewegungsplaner konstruiert einen Plan und kann
im Allgemeinen eine Maschine oder ein Mensch sein. Wenn der Bewegungs-
planer Teil einer Maschine ist, wird er als Planungsalgorithmus betrachtet. In
Fällen, in denen der Mensch die Bewegungsplanung vornimmt, übernimmt
er die Rolle des Algorithmus.
2.4.2 Bewegungsplanung in diskreten Weltmodellen
Die gitterbasierte diskrete Bewegungsplanung basiert auf einem einfach zu
beschreibenden Weltmodell, dessen Zustandsraum in vielen Fällen endlich
ist. Daher sind keine geometrischen Modelle oder Differenzialgleichungen
erforderlich, um diskrete Planungsprobleme zu charakterisieren. Die Grund-
idee ist, dass jede unterschiedliche Situation der Welt als ein Zustand z
angenommen wird und die Menge aller möglichen Zustände den Zustands-
raum Z bildet. Für die diskrete Planung ist es wichtig, dass diese Menge
abzählbar ist (vgl. [LaV06] S. 28ff).
Das Weltmodell kann durch die Anwendung von Aktionen, die vom
Bewegungsplaner ausgewählt werden, transformiert werden. Jede Aktion
u, wenn sie vom aktuellen Zustand z aus angewendet wird, erzeugt einen
neuen Zustand z′, der durch eine Zustandsübergangsfunktion f spezifiziert
wird. Mit f lässt sich die folgende Zustandsübergangsgleichung aufstellen:
z′ = f (z,u)
Mit U(z) wird der Aktionsraum für jeden Zustand z bezeichnet, der die
Menge aller Aktionen darstellt, die von x aus angewendet werden können.
Für verschiedene z,z′ ∈ Z sind U(z) und U(z′) nicht notwendigerweise
disjunkt, da die gleiche Aktion in mehreren Zuständen anwendbar sein kann.
Die Definition eines Bewegungsplanungsproblems beginnt üblicherweise mit
einem Initialzustand zI ∈ Z und beinhaltet eine Menge von Zielzuständen
ZG ⊂ Z , die zur Lösung des Problems erreicht werden müssen. Die Aufgabe
des Bewegungsplaners ist die Suche nach einer geeigneten Sequenz von
Aktionen, die einen der Zielzustände erreicht.
Ein typisches Weltmodell für die diskrete Bewegungsplanung geht von
einem gitterbasierten Layout aus, bei dem jeder Gitterpunkt ganzzahlige
Koordinaten der Form (x,y) hat. Innerhalb dieses Modells kann ein Bewe-
gungsobjekt diskrete Schritte in eine von vier Richtungen (Norden, Süden,
Osten, Westen) machen, wobei jeder Schritt eine Koordinate erhöht oder
verringert. Die Bewegungen und der zugehörige Zustandsübergangsgraph
sind in Abbildung 2.1 dargestellt. Man kann sie sich als einzelne Schritte auf
einem unendlichen Fliesenboden vorstellen.
Die Zustandsmenge Z in diesem Weltmodell sei die Menge aller ganz-
zahligen Paare der Form (x,y), wobei x,y ∈ Z ist. Die Aktionsmenge
U = {(0,1), (0,−1), (1,0), (−1,0)} definiert alle Aktionen, die ausgeführt
34 2 Grundlagen
Abb. 2.14 Zustandsübergangsgraph für ein unendliches gitterbasiertes Weltmodell nach
[LaV06]
werden können. Im allgemeinen Fall eines unendlichen Gitters gilt für alle
z ∈ ZundU(z) =U. Die Zustandsübergangsgleichung lautet f (z,u) = z+ u,
wobei z ∈ Z und u ∈ U als zweidimensionale Vektoren zur Addition be-
handelt werden. Wenn zum Beispiel z = (9,2) und u = (0,−1), dann ist
f (z,u) = (9,1).
Grenzen und Hindernisse können zumWeltmodell hinzugefügt werden,
indem Gitterpunkte gesperrt werden. Für die nicht blockierten benachbarten
Gitterpunktewird die AktionsmengeU(z) so reduziert, dass keine Bewegung
in das Hindernis hinein möglich ist. Eine äußere Begrenzung kann durch
Einschließen einer begrenzten Region entworfen werden, was dazu führt,
dass X endlich wird.
Abb. 2.15 Gitterbasiertes Weltmodell mit Hindernissen und Außengrenze nach [LaV06]
2.4 Planung und Verwaltung von Objektbewegungen 35
Suche in gitterbasierten Weltmodellen
Zur Lösung des Bewegungsplanungsproblems durschucht der Bewegungs-
planer den Zustandsübergangsgraphen nach einer durchführbaren Sequenz
von Aktionen, die vom Initialzustand in einen Zielzustand führt. Dazu wer-
den graphenbasierte Suchalgorithmen verwendet, die die Knoten des Gra-
phen entlang seiner Kanten durchsuchen. Wichtig bei der Auswahl eines
Suchalgorithmus ist, dass er systematisch vorgeht und jeden Knoten des
Zustandsübergangsgraphen betrachtet.
Neben der klassischen Tiefen- und Breitensuche sind insbesondere der
Algorithmus von Dijkstra sowie der A∗-Algorithmus zu nennen. Die letzt-
genannten haben den Vorteil, dass sie nicht nur einen durchführbaren Plan
finden, sondern auch einen optimalen Plan bestimmen können.
Multi-Agent Pathfinding in gitterbasierten Weltmodellen
Die Koordination der Bewegung einer Vielzahl von Robotern oder Agen-
ten ist ein jahrzehntealtes Problem der Robotikforschung (siehe Unterab-
schnitt 2.4.5). Auf Basis eines spezifischen Anwendungsfalls aus der Logistik
– es hancdelt sich um das Kommissioniersystem von Amazon Robotics (ehe-
mals Kiva) – ist in den letzten Jahren das Forschungsfeld zu diesem Thema
für diskrete Weltmodelle deutlich weiterentwickelt worden (vgl. [WDM08]).
In [SS20] wird ein guter Überblick zur aktuellen Forschung gegeben. Formal
wird das Basisproblem alsMulti Agent Path Finding (MAPF) bezeichnet. Es
handelt sich hier um die Aufgabe, einen kollisionsfreien Pfad vom Start zum
Ziel für jedes bewegte Objekt zu finden. Formal kann die Problemstellung
folgendermaßen beschrieben werden:
• ein WeltmodellW = R2
• ein diskretisiertes Zeitintervall T = [0, t f ] ∈N, wobei der Zeitpunkt t f
als die Zielerreichung des letzten Objekts definiert ist
• die bewegten Objekte, repräsentiert durch k Agenten A1, . . . ,Ak
• für jeden Agenten i ein Konfigurationsraum Ci als Diskretisierung
vonW mit qi = (x,y) für alle qi ∈ Ci und x,y ∈Z
• eine grundlegende Menge von Aktionen
B = {(0,0), (0,1), (0,−1), (1,0), (−1,0)}, wobei b = (0,0) das Verbleiben
in der selben Konfiguration bedeutet
• eine statische Hindernisregion O ⊂ C, die sich niemals ändert
• ein Zustandsraum Z , der als kartesisches Produkt Z = C1 × C2 × · · · ×
Ck × T definiert ist
• eine Aktionsmenge U, die als kartesisches Produkt U = B1 × · · · × Bk ×
{1} definiert ist
• eine Zustandsübergangsgleichung f (z,u) = z+ umit z ∈ Z und u ∈U
36 2 Grundlagen
• eine Hindernisregion in(Z , die)als 
×k ⋃  ⋃Z O × T Z ijobs = 

obs
i=1 ij, i 6=j
definiert wird und bei der Z ijobs eine dynamische Hindernisregion für ein
Agentenpaar A1 und Aj darstellt
• der freie Zustandsraum Z f ree = Z\Zobs
• ein Initialzustand zinit ∈ Z f ree,(der die Initialko)nfigurationen
z = q1init init, . . . ,q
k
init, 0
aller bewegten Objekte beinhaltet
• ein Zielzustand zziel ∈ Z f ree, d(er die Zielkonfigu)rationen
zziel = q1 kziel , . . . ,qziel , tF
aller bewegten Objekte beinhaltet
Die hier gewählte Form der Problembeschreibung orientiert sich an dem Vor-
gehen bei LaValle und vermeidet eine spezifische Graphstruktur G = (V,E)
zugunsten eines diskretisierten Raums mit einer darauf definierten diskreten
Aktionsmenge. Beides ist äquivalent, aber die hier gewählte Form vereinfacht
den Übergang und Vergleich zu einem kontinuierlichen Zustandsraum.
Der Zeitfortschritt ist diskret, und in jedem Schritt wählt jeder Agent Ai
eine mögliche Aktion b ∈ B aus, wobei er sich entweder in eine benachbarte
Gitterzelle bewegt oder in seiner bisherigen Zelle verbleibt. Eine Aktion
gilt als konfliktfrei, wenn keine zwei Agenten zur gleichen Zeit in derselben
Gitterzelle positioniert sind und auch kein direkter Platztausch stattfindet,
bei dem sich die Agenten im selben Zeitschritt durcheinander bewegen.
Formal ist das über die Definition der dynamischen Hindernisregion Z ijobs
beschrieben, die für jedes unterschiedliche Agentenpaar Ai,Aj mit i 6= j alle
Zustände z ∈ Z beinhaltet, bei denen qi = qj.
Ein vollständiger Algorithmus berechnet für alle Agenten einen konflikt-
freien Pfad von der Initialposition bis zum Ziel. Ein optimaler Algorithmus
minimiert zusätzlich entweder die Zykluszeit (engl. makespan) oder die
Summe der Durchlaufzeiten (engl. flowtime) des Gesamtsystems.
2.4.3 Bewegungsplanung in kontinuierlichen Weltmodellen
Die Bewegungsplanung in kontinuierlichen Weltmodellen vermeidet die
direkte Diskretisierung des Zustandsraums und nimmt in Kauf, dass dieser
nicht mehr explizit abgebildet werden kann, da er unabzählbar unendlich
2.4 Planung und Verwaltung von Objektbewegungen 37
wird. Sie erfordert eine zusätzliche, manchmal komplexe Transformation
zwischen dem kontinuierlichenWeltmodell, in dem ein Plan ausgeführt wird,
und dem Raum, in dem die Planung stattfindet.
Diese Trennung von Weltmodell und Planungsraum führt zum Konzept
des Konfigurationsraums, dessen Dimensionalität von den Freiheitsgraden
des zu bewegenden Objekts abhängt. Über das Konzept des Konfigurati-
onsraums kann die Bewegungsplanung als eine Art von Suche in einem
hochdimensionalen Zustandsraum angesehen werden. Eine Komplikation
besteht darin, dass Konfigurationsräume eine ungewöhnliche topologische
Struktur haben, die korrekt charakterisiert werden muss, damit Planungsal-
gorithmen korrekt funktionieren. Ein Bewegungsplan kann anschließend als
ein kontinuierlicher Pfad im Konfigurationsraum definiert werden.
Auch wenn das Weltmodell kontinuierlich bleibt, transformieren die Pla-
nungsalgorithmen das kontinuierliche Modell irgendwann und irgendwie
in ein diskretes Modell. Dieser transformierende Prozess der Diskretisie-
rung ist charakteristisch für die Entwicklung verschiedener Algorithmen
für spezifische Problemstellungen. LaValle stellt in seinem Grundlagenwerk
systematisch verschiedene Ansätze vor. Er stellt fest, dass sich mit kombi-
natorisch vollständigen Methoden theoretisch praktisch jedes Bewegungs-
planungsproblem lösen lässt. In einigen wenigen Fällen lassen sich in der
Praxis sehr elegante Lösungen erstellen. Für die Mehrzahl der industrie-
bezogenen Bewegungsplanungsprobleme sind diese Algorithmen jedoch
aufgrund ihrer Laufzeiten und Implementierungsschwierigkeiten uninter-
essant. Im Gegensatz dazu haben stichprobenbasierte Algorithmen einen
großen Teil der praktischen Probleme gelöst, auch wenn die Vollständigkeits-
garantien schwächer sind. Ein großer Vorteil ist ihre Effizienz und einfache
Implementierung für eine Vielzahl von Anwendungen (vgl. [LaV06] S. 80ff).
Geometrische Repräsentation und Transformation von Hindernissen
und beweglichen Objekten
In einem kontinuierlichenWeltmodell bedarf es einer explizit definierten geo-
metrischen Repräsentation von bewegten Objekten und Hindernissen. Dazu
existieren grundsätzlich zwei alternative Ansätze. Entweder werden nur die
geometrischen Grenzen betrachtet oder es werden solide Objekte verwendet,
deren Punktmengen bestimmt werden. Zunächst wird das Weltmodell als
die MengeW definiert, deren Dimension in den meisten praktischen Anwen-
dungen aufW = R2 (2D-Welt) oderW = R3 (3D-Welt ) beschränkt ist. Des
Weiteren enthält diese Welt zwei Arten von Entitäten:
• Hindernisse Teile der Welt gelten als dauerhaft belegt (z. B. Wände in
einem Gebäude). Die HindernisregionO ⊆W beschreibt die Menge aller
Punkte, die innerhalb von unbeweglichen Hindernissen liegen.
38 2 Grundlagen
• Bewegliche Objekte Es existiert eine Anzahl von beweglichen Objekten
0, . . . ,n, deren physische Körper jeweils über eine Menge an belegten
Punkten A0, . . . ,An abgebildet sind. Es gilt A 2 3x ∈ R oder Ax ∈ R für
die Menge der Punkte, die ein bewegliches Objekt x belegt, wobei die
Dimension von Ax mit der WeltW übereinstimmt.
Während die unbeweglichen Hindernisse ausO durch Polygone oder andere
geometrische Modelle abgebildet werden, die effizient in einem Rechner
verarbeitet werden können (vgl. [LaV06] S. 82ff), bedarf es bei einem beweg-
lichen Objekt A zusätzlich zur Abbildung des Körpers eine Beschreibung
seiner Position und Orientierung inW . Diese Transformation wird als Funk-
tion h : A 7→ W angegeben. Dabei wird der Körper als starr im Sinne der
TechnischenMechanik angesehen, sodass nach einer Transformation für jedes
Punktpaar in A die euklidische Distanz erhalten bleiben muss. Zusätzlich
ist gefordert, dass die Orientierung des Objekts erhalten bleibt, da Spiegel-
bilder nicht erlaubt sind. Grundsätzlich können unterschiedliche Arten von
Transformationen über einen zusätzlichen Parametervektor q ∈Rn definiert
werden, sodass h(q, a) für jeden transformierten Punkt a ∈ A und für das
ganze Objekt h(q,A) ⊂W gilt. LaValle führt als vereinfachte Schreibweise
die Notation A(q) ein. Dabei wird erst durch die Transformation A in W
platziert, die Funktion ist technisch gesehen eine orientierungserhaltende
isometrische Einbettung (vgl. [LaV06] S. 94). Jeder Punkt a ∈ A wird in ei-
nem objektbezogenen Koordinatensystem notiert, während für jeden Punkt
w ∈W das Koordinatensystem des Weltmodells verwendet wird.
Für den für diese Arbeit relevanten Fall W = R2 (2D-Welt) beschreibt
LaValle die beiden Transformationen der Translation und der Rotation. Ein
bewegliches Objekt A ∈ R2 wird unter Zuhilfenahme des Parameters q =
(xt,yt)mit xt,yt ∈R translatorisch bewegt. Die Funktion h ist in diesem Fall
wie folgt definiert:
h(x,y) = (x+ xt,y+ yt).
Für die Rotation von A gegen den Uhrzeigersinn nach einem Winkel θ ∈
[0,2π) wird jeder Punkt (x,y) ∈ A nach folgender Gleichung abgebildet:
(x,y) 7→ (x cos θ − y sin θ,x sin θ + y cos θ).
Eine Kombination aus Rotation mit anschließender Translation wird über
eine sogenannte homogene Transformationsmatrix abgebildet, die mit
cosθ −sinθ xt
T = sinθ cosθ yt
0 0 1
2.4 Planung und Verwaltung von Objektbewegungen 39
ausgedrückt werden kann. In vereinfachter Notation lässt sich die Transfor-
mation mit A(xt,yt,θ) schreiben. Die drei Parameter weisen dabei auch auf
die drei Freiheitsgrade des beweglichen Objekts in einer 2D-Welt hin.
Für den hier nicht betrachteten Fall einer 3D-Welt kann das Transformati-
onskonzept im Prinzip übernommen werden, wobei die Rotation deutlich
komplexer wird (vgl. [LaV06] S. 97ff).
Konfigurationsraum
In Abschnitt 2.4.3 wurde nur die grundsätzliche Modellierung und Transfor-
mation von Hindernissen und beweglichen Objekten betrachtet. Für die wei-
tere Bewegungsplanung ist eine Definition des Zustandsraums notwendig,
über den die Menge der möglichen Transformationen für das zu bewegende
Objekt abgebildet wird (vgl. [LaV06] S. 127ff). Das Konzept des Konfigurati-
onsraums gehört zu den Grundlagen der Bewegungsplanung in der Robotik
und basiert in weiten Teilen auf einer Anwendung von Konzepten der Topo-
logie aus der Mathematik. Der Konfigurationsraum stellt eine Abstraktion
des zugrunde liegenden Weltmodells dar und ermöglicht eine allgemeine
Beschreibung und Lösung von Problemen der Bewegungsplanung.
Grundlegende topologische Konzepte
Die grundlegenden topologischen Konzepte werden im Standardwerk von
LaValle beschrieben und werden hier nicht vollständig mit allen Beispie-
len wiedergegeben (vgl. [LaV06] S.127ff). Die wichtigsten Konzepte für die
Bewegungsplanung in dieser Arbeit sollen hier genannt werden, damit die
folgenden Ausführungen zumKonfigurationsraum darauf aufbauen können.
Topologischer Raum Das Konzept des topologischen Raums ermöglicht ei-
nen Umgang mit unabzählbaren unendlichen Weltmodellen. Es kann als
Generalisierung der Konzepte offener und geschlossener Intervalle in R auf-
gefasst werden. Die in beiden Fällen vorhandenen Grenzpunkte ermöglichen
die Bestimmung einer unendlichen Untermenge, ohne die gesamte Menge
zu diskretisieren.
Eine Menge X wird dann topologischer Raum genannt, wenn es eine Anzahl
von Untermengen von X gibt, die offene Mengen genannt werden und für die
folgende Axiome gelten:
• Die Vereinigung einer beliebigen Anzahl von offenen Mengen ist eine
offene Menge.
• Die Schnittmenge einer endlichen Anzahl von offenen Mengen ist eine
offene Menge.
• Sowohl X als auch ∅ sind offene Mengen.
40 2 Grundlagen
Für den Fall X = R sind erwartungsgemäß offene Intervalle wie (0,1) ein
Beispiel für offene Untermengen.
Geschlossene Mengen Eine Untermenge C ⊂ X eines topologischen Raums
X ist genau dann eine geschlossene Menge, wenn das Komplement X\C eine
offene Menge ist. Ein Beispiel hierfür ist das geschlossene Intervall [0,1] ∈R,
dessen Komplement (−∞,0) ∪ (1,∞) eine offene Menge ist.
Besondere Punkte Für die Bewegungsplanung sind einige weitere Begriffe,
die auf topologischen Räumen definiert werden können, von besonderem
Interesse. Sei X ein topologischer Raum und seiU eine beliebige Untermenge
von X. Des Weiteren sei x ein beliebiger Punkt in X. Die folgenden Begriffe
beschreiben die jeweilige Beziehung eines Punktes x zur Untermenge U:
• Innerer PunktWenn es eine offeneMengeO1 mit x∈O1 undO1⊆U gibt,
dann wird x als innerer Punkt von U bezeichnet. Die Menge aller inneren
Punkte von U wird Inneres von U genannt und mit int(U) bezeichnet.
• Außenliegender PunktWenn es eine offene Menge O2 mit x ∈O2 und
O2 ⊆ X\U gibt, dann wird x als äußerer Punkt in Bezug auf U genannt.
• RandpunktWenn x weder ein innerer noch ein außenliegender Punkt
ist, dann wird er Randpunkt genannt. Die Menge aller Randpunkte wird
Rand von U genannt und mit ∂U bezeichnet.
• Grenzpunkt Wenn x ∈ int(U) ∨ x ∈ ∂U, dann wird er zusätzlich als
Grenzpunkt bezeichnet. Die Menge aller Grenzpunkt von U ist eine ge-
schlosseneMenge, die Abschluss vonU genannt undmit cl(U) bezeichnet
wird. Der Abschluss kann durch cl(U) = int(U) ∪ ∂U gebildet werden.
Für den Fall X = R sind Randpunkte die Endpunkte von Intervallen. Zum
Beispiel sind 0 und 1 die Randpunkte der Intervalle (0,1), [0,1], [0,0) und
(0,1].
Hausdorff-Axiom Sei X ein topologischer Raum. Wenn es für jedes eindeuti-
ge x1,x2 ∈ X jeweils eine offene Menge O1 und O2 gibt, sodass gilt x1 ∈O1,
x2 ∈ O2 und O1 ∩O2 = ∅, dann erfüllt X das Hausdorff- Axiom und wird
auch Hausdorff-Raum genannt. Das Hausdorff-Axiom ist von grundlegender
Bedeutung, da es eine der möglichen Trennungseigenschaften in topologischen
Räumen beschreibt.
Kontinuität Die Definition der Kontinuität lässt sich über eine Funktion
f : X 7→ Y, die eine Abbildung zwischen den topologischen Räumen X und
Y beschreibt, einführen. Sei für jede Untermenge B ⊆ Y das Vorbild durch
f−1(B) = {x ∈ X | f (x) ∈ B}
2.4 Planung und Verwaltung von Objektbewegungen 41
definiert. Dann ist f kontinuierlich, wenn f−1(O) eine offene Menge für jede
offene Menge O ⊆ Y ist.
Homöomorphismus Sei f : X 7→ Y eine bijektive Funktion zwischen den
topologischen Räumen X und Y, dann existiert die inverse Funktion f−1.
Wenn sowohl f als auch f−1 kontinuierlich sind, dann wird f ein Homöomor-
phismus genannt. Wenn es mindestens einen Homöomorphismus zwischen
zwei topologischen Räumen gibt, dann werden sie homöomorph genannt und
können als X ∼= Y geschrieben werden. Implizit ist hierdurch eine Äquiva-
lenzbeziehung auf der Menge topologischer Räume gegeben.
Ein sehr bekanntes Beispiel für zwei homöomorphe topologische Räume
sind eine Kaffeetasse mit einem Henkel und ein Donut.
Jedes offene Intervall in R ist homöomorph zu jedem anderen offenen In-
tervall. Zum Beispiel kann (0,1) über die kontinuierliche Abbildung x 7→ 5x
auf (0,5) abgebildet werden, wobei (0,1) und (0,5) als topologische Unter-
räume von R angesehen werden.
Mannigfaltigkeiten
In der Bewegungsplanung wird das Konzept der Mannigfaltigkeit eingesetzt,
damit ein Konfigurationsraum die Eigenschaften der zugrunde liegenden
Struktur des Transformationsraums widerspiegelt. Das Konzept der Man-
nigfaltigkeit kann aus Sicht der Bewegung von physischen Objekten mit der
intuitiven Vorstellung von einer Oberfläche verglichen werden, über die sich
Objekte bewegen können.
Ein topologischer Raum M ⊆Rm ist eine topologische Mannigfaltigkeit,
wenn für jedes x ∈ M eine offene Menge O ⊂ M existiert, sodass x ∈ O, O
homöomorph zu Rn und n für alle x ∈ M festgelegt ist. Die Anforderung
der Homöomorphie zu Rn bedeutet intuitiv, dass an jedem Punkt x ∈ M die
gleiche Menge an möglichen Bewegungsrichtungen existiert wie für einen
Punkt y ∈ Rn.
Kartesische Produkte Seien X und Y topologische Räume. Das kartesische
Produkt X × Y definiert einen neuen topologischen Raum. Für jedes x ∈ X
und y ∈ Y wird ein Punkt (x,y) ∈ X×Y generiert. Für jedes mögliche Paar
von offenen Mengen in X und Y wird eine offenen Menge in X×Y erzeugt.
Aus diesen Mengen können durch Vereinigung oder Schnitt alle weiteren
offenen Mengen von X×Y erzeugt werden.
Ein gutes Beispiel für ein kartesisches Produkt in der Bewegungsplanung
(und in dieser Arbeit) ist R×R, das auch als R2 geschrieben wird. Im All-
gemeinen ist Rn äquivalent zu Rn−1 ×R. Viele für die Bewegungsplanung
wichtige Mannigfaltigkeiten werden durch kartesische Produkte konstruiert.
42 2 Grundlagen
1D-Mannigfaltigkeiten Die Menge R ist das anschaulichste einfache Bei-
spiel für eine eindimensionale Mannigfaltigkeit. Interessant ist in diesem
Zusammenhang auch die Mannigfaltigkeit, die durch das offene Einheitsin-
tervall (0,1) beschrieben wird. Dieses ist homöomorph zu R, da jede offene
Menge von R durch eine einfache Abbildungsfunktion gebildet werden
kann.
Eine weitere eindimensionale Mannigfaltigkeit, die nicht homöomorph zu
(0,1) ist, beschreibt einen topologischen Kreis. Sei Rm = R2, dann sei
S1 = {(x,y) ∈R2 | x2 + y2 = 1}.
Aus topologischer Sicht können alle Mannigfaltigkeiten als topologischer
Kreis angesehen werden, die homöomorph zu S1 sind (vgl. [LaV06] S. 135).
Identifizierung Eineweitere Art, S1 zu definieren, kann über eine sogenannte
Identifizierung erfolgen. Sei X ein topologischer Raum, dann sei mit X/ ∼
ein topologischer Raum bezeichnet, der in irgendeiner Weise durch eine
Identifizierung neu definiert wurde.
Somit kann S1 als [0,1]/ ∼ neu definiert werden und können durch 0∼ 1
die beiden Werte 0 und 1 als äquivalent deklariert werden. Dies hat intuitiv
den Effekt, dass die beiden Enden des geschlossenen Einheitsintervalls [0,1]
aneinandergeklebt werden. Auf diese Weise kann gezeigt werden, dass S1
durch eine geeignete Abbildung auch homöomorph zu [0,2π] oder [0,360]
ist. Mit der Mannigfaltigkeit S1 lässt sich eine Rotation in allgemeiner Weise
beschreiben (siehe auch [Que01] S. 44ff).
2D-Mannigfaltigkeiten Viele für die Bewegungsplanung wichtige zweidi-
mensionale Mannigfaltigkeiten werden über die Anwendung des kartesi-
schen Produkts auf 1D-Mannigfaltigkeiten erzeugt. Die 2D-Mannigfaltigkeit
R2 wird über R×R gebildet. Ein unendlicher Zylinder lässt sich mit R× S1
definieren, während ein Torus (die Oberfläche eines Donuts oder einer Kaf-
feetasse) über S1 × S1 definiert werden kann. Über eine Identifikation lassen
sich 2D-Mannigfaltigkeiten erzeugen, die beispielsweise einMöbiusband re-
präsentieren (vgl. [LaV06] S. 136).
Pfade, Homotopie und räumlicher Zusammenhang
Eine zentrale Fragestellung der Bewegungsplanung ist, ob ein Punkt im
Raum von einem anderen Punkt aus erreichbar ist. Dies kann für diskrete
Räume durch die Untersuchung des Zusammenhangs des Zustandsgra-
phen untersucht werden, dessen Kanten die möglichen Zustandsübergänge
abbilden. Im kontinuierlichen Raum stellt sich die Frage, ob es einen konti-
nuierlichen Pfad zwischen zwei Punkten gibt (vgl. [LaV06] S. 139).
2.4 Planung und Verwaltung von Objektbewegungen 43
Pfad Sei X ein topologischer Raum und in diesem Fall auch eine Mannigfal-
tigkeit. Ein Pfad ist eine kontinuierliche Funktion τ : [0,1]→ X. Jeder Punkt
des Pfades ist durch τ(s)mit s ∈ [0,1] gegeben.
Pfadzusammenhang Ein topologischer Raum X gilt als pfadzusammenhän-
gend, wenn für alle x1,x2 ∈ X ein Pfad τ existiert, so dass τ(0) = x1 und
τ(1) = x2.
Homotopie Zwei Pfade τ1 und τ2, die gemeinsame feste Start- und End-
punkte haben, gelten dann als homotop, wenn eine kontinuierliche Funktion
h : [0,1]× [0,1]→ X existiert, für die folgende Bedingungen erfüllt sind:
• h(s,0) = τ1(s) für alle s ∈ [0,1]
• h(s,1) = τ2(s) für alle s ∈ [0,1]
• h(0, t) = h(0,0) für alle t ∈ [0,1]
• h(1, t) = h(1,0) für alle t ∈ [0,1]
Der Parameter t steuert die graduelle Verformung des Pfades von τ1 bei t= 0
zu τ2 bei t = 1. Dieser Umstand wird durch die ersten beiden Bedingun-
gen abgesichert. Die letzten beiden Bedingungen bedeuten, dass Start- und
Endpunkt unverändert bleiben.
Da h als kontinuierliche Funktion abgebildet wird, kann während der
Verformung der abgebildete Pfad keine diskontinuierlichen Sprünge machen.
Für den Fall der Mannigfaltigkeit R2 wird dadurch ein Überspringen von
Löchern oder Hindernissen verhindert.
Einfacher und mehrfacher Zusammenhang Sei X ein pfadzusammenhän-
gender topologischer Raum. Dann definiert die Homotopie eine Äquivalenz-
relation über die Menge aller Pfade, die zwei Punkte x1,x2 ∈ X miteinander
verbinden. Wenn alle Pfade in dieselbe Äquivalenzklasse fallen, dann wird
X als einfach zusammenhängend bezeichnet. Andernfalls wird X als mehrfach
zusammenhängend bezeichnet.
Definition des Konfigurationsraums
Der Konfigurationsraum soll im Folgenden als Mannigfaltigkeit definiert wer-
den, die aus den möglichen Transformationen ensteht, die ein bewegliches
Objekt innerhalb eines Weltmodells ausführen kann. Um ein Bewegungs-
planungsproblem zu lösen, wird der Konfigurationsraum durchsucht. Er
abstrahiert komplizierte geometrischeModelle und Transformationen spezifi-
scher Systemausprägungen und überführt diese auf das allgemeine Problem
der Pfadsuche in einer Mannigfaltigkeit. Algorithmen, die eine Lösung für
diese allgemeine Problemstellung bereitstellen, können auf eine Vielzahl von
praktischen Problemstellungen angewandt werden.
44 2 Grundlagen
Zweidimensionale starre Körper Da im Fall eines starren Körpers jedes
xt,yt ∈R für eine Translation ausgewählt werden kann, ergibt sich hierfür
die Mannigfaltigkeit M 21 = R . Unabhängig davon kann jede Rotation um
denWinkel θ ∈ [0,2π) angewendet werden. Da 2π und 0 die gleiche Transfor-
mation darstellen, können sie durch 2π ∼ 0 identifiziert werden. Die daraus
entstehendeMannigfaltigkeit M2 ist homöomorph zu S1 und stellt die Menge
aller 2D-Rotationen dar.
Der Konfigurationsraum C = M1 ×M = R22 × S1 beschreibt alle mögli-
chen Transformationen für starre Körper in einer zweidimensionalen Welt.
Hindernisse im Konfigurationsraum
Im vorherigen Abschnitt wurde der Konfigurationsraum C ohne Hindernisse
betrachtet, sodass alle möglichen Konfigurationen gültig sind. Sobald Hin-
dernisse berücksichtigt werden, müssen sämtliche Konfigurationen, die zu
einer Kollision zwischen bewegtem Objekt und Hindernis führen, aus dem
Konfigurationsraum entfernt werden.
Sei mitW = R2 ein Weltmodell im zweidimensionalen Raum gegeben,
das eine HindernisregionO ⊂W enthält. Des Weiteren wird ein bewegliches
Objekt A ⊂W angenommen, das als starrer Körper definiert ist.
Sei q ∈ C die Konfiguration von A, die mit q = (xt,yt,θ) definiert ist. Die
Hindernisregion Cobs ⊆ C wird über
Cobs = {q ∈ C | A(q) ∩O 6= ∅}
definiert und beschreibt die Menge der Konfigurationen aus C, bei denen
sich das transformierte ObjektA(q)mit den HindernissenO schneidet. DaO
und A(q) geschlossene Mengen inW sind, ist Cobs eine geschlossene Menge
in C.
Der übrigbleibende Teil der Konfigurationen wird freier Raum genannt
und ist als C f ree = C\Cobs definiert.
Das Problem des KlaviertransporteursMit dem Problem des Klaviertrans-
porteurs für zweidimesionale Welten wird die klassische Problemstellung
der Bewegungsplanung im Allgemeinen beschrieben. Die Komponenten der
Problemstellung lassen sich wie folgt auflisten:
• ein WeltmodellW = R2
• eine Hindernisregion O ⊂W
• ein bewegtes Objekt A, das inW definiert ist
• der Konfigurationsraum C, der durch die Bestimmung aller möglichen
Transformationen entsteht, die auf A angewendet werden können; die
abgeleitete Hindernisregion Cobs und der freie Raum C f ree
• eine Initialkonfiguration qi ∈ C f ree
2.4 Planung und Verwaltung von Objektbewegungen 45
• eine Zielkonfiguration qg ∈ C f ree
Ein vollständiger Algorithmus muss einen kontinuierlichen Pfad τ : [0,1]→
C f ree berechnen, sodass τ(0) = qi und τ(1) = qg sind oder die korrekte Rück-
meldung geben, dass ein solcher Pfad nicht existiert.
Es wurde gezeigt, dass dieses Problem PSPACE-hart ist, was NP-hart
impliziert (vgl. [LaV06] S. 158).
Metrische Räume
Eine grundlegende Operation für Algorithmen in der Bewegungsplanung ist
die Messung der Distanz zwischen zwei Punkten im Raum. Es ist einfach,
den euklidischen Abstand in Rn zu definieren. Um eine Abstandsfunktion
über einem beliebigen C zu definieren, müssen jedoch bestimmte Axiome
erfüllt sein, damit sie mit den intuitiven Erwartungen auf der Grundlage des
euklidischen Abstands übereinstimmt.
Die folgenden Definitionen und Axiome bilden die Basis für eine Funktion,
die einen topologischen Raum zu einem metrischen Raum weiterentwickelt.
Einmetrischer Raum (X,ρ) ist ein topologischer Raum X, über den eine Funkti-
on ρ : X×X→R definiert ist, so dass für beliebige Punkte a,b, c ∈ X folgende
Eigenschaften gelten:
• ρ(a,b) ≥ 0 (Nicht-Negativität)
• ρ(a,b) = 0 genau dann, wenn a = b (Reflexivität)
• ρ(a,b) = ρ(b, a) (Symmetrie)
• ρ(a,b) + ρ(b, c) ≥ ρ(a, c) (Dreiecksungleichheit)
Die Funktion ρ definiert die Distanzen zwischen zwei Punkten immetrischen
Raum, und die vier Bedingungen entsprechen der intuitiven Vorstellung über
das Konzept der Distanz. Insbesondere die letzte Bedingung impliziert eine
Optimalität von ρ in dem Sinn, dass die Distanz zwischen zwei Punkten stets
weniger oder gleich groß ist als der Weg über einen Zwischenpunkt.
Die wichtigste Familie von Metriken über Rn sind die sogenannten Lp-
Metriken, die für ein beliebiges p(≥ 0 mit ) 1
n p
ρ(x,x′) = ∑ | x − x′ |pi i
i=1
bestimmt werden können. In dieser Arbeit werden die Metriken für p = 1
und p = 2 verwendet. Sie spielen eine zentrale Rolle bei dem Vergleich von
kontinuierlichen Räumen und gitternetzbasierten Räumen:
• L1: Die Manhattan-Metrik wird so genannt, da sie in R2 mit der Länge
eines Pfades korrespondiert, der sich entlang eines achsenausgerichteten
Gitters bewegt.
46 2 Grundlagen
• L2: die euklidische Metrik, die der euklidischen Distanz entspricht
Der Fall p = 2 kann auch über den Betrag eines Vektors ausgedrückt werden,
die sogenannte euklidische Norm. Für die L2-Metrik gilt dann ρ(x,y) = ‖x− y‖
(vgl. [LaV06] S. 187).
Kollisionserkennung
Die Erkennung von Kollisionen zwischen zwei Objekten im Konfigurations-
raum ist eine wichtige Komponente bei der Bewegungsplanung. Da in sehr
vielen Bewegungsplanungsalgorithmen die meiste Rechenzeit für die Kollisi-
onserkennung aufgewendet wird, erhöht sich die Relevanz der genaueren
Betrachtung der Problemstellung. Für den Fall eines zweidimensionalen
Weltmodells und konvex geformter Objekte gibt es glücklicherweise einen
Algorithmus mit linearer Laufzeit (vgl. [LaV06] S. 209).
Kollisionserkennung als logisches Prädikat Kollisionserkennung lässt sich
als logisches Prädikat betrachten, das als Funktion φ : C → {TRUE,FALSE}
in Erscheinung tritt. Wenn eine Konfiguration q ∈ Cobs, dann ist φ(q) = TRUE,
andernfalls ist φ(q) = FALSE.
Abstand zweier Mengen Neben der grundsätzlichen Information, ob eine
Kollision vorliegt, ist auch der Abstand zweier Objekte eine wichtige In-
formation für Planungsalgorithmen. Eine sogenannte Distanzfunktion ist als
d : C → [0,∞) definiert, derenWert die Distanz imWeltmodellW abbildet, die
zwischen dem sich am nächsten liegenden Punktpaar aller Punktpaare aus
A(q) und O existiert. Im Allgemeinen ist die Distanz zweier geschlossener,
begrenzter Teilmengen E und F au{s Rn w{ie folgt de}fi}niert:
ρ(E,F) =min min ‖e− f ‖ .
e∈E f∈F
Dabei ist ‖ · ‖ die euklidische Norm. Wenn E ∩ F 6= ∅, dann ist ρ(E,F) = 0.
Kollisionserkennung in zwei PhasenWenn sich in einemWeltmodell eine
große Anzahl von Objekten befindet, dann kann es hilfreich sein, die Kolli-
sionserkennung in zwei Phasen zu unterteilen und so die Komplexität und
den Berechnungsaufwand einzugrenzen:
• Weitphase In der umfassendenWeitphase sollen aufwändige detaillierte
Berechnungen vermieden werden, indem Objekte ausgeschlossen wer-
den, die weit voneinander entfernt sind. Dies geschieht in der Regel
durch vereinfachende Datenstrukturen (Bounding Boxes) oder den Ein-
satz von Hashing-Methoden.
• Nahphase In der Nahphase werden individuelle Objektpaare im Detail
verglichen, sodass eine genaue Kollisionserkennung durchgeführt wird.
2.4 Planung und Verwaltung von Objektbewegungen 47
Das Konzept für eine zweiphasige Vorgehensweise basiert auf der Er-
kenntnis, dass der Berechnungsaufwand für die Bewegungsplanung einen
sehr großen Einfluss auf die praktische Anwendbarkeit eines spezifischen
Algorithmus haben kann.
Kollisionserkennung für kontinuierliche Pfade Kollisionserkennungsalgo-
rithmen stellen fest, ob eine Konfiguration (an einem Punkt im Raum) in C f ree
liegt, aber Bewegungsplanungsalgorithmen erfordern, dass ein gesamter
Pfad in C f ree abgebildet wird. Die Schnittstelle zwischen der Bewegungspla-
nung und der Kollisionserkennung beinhaltet in der Regel die Validierung
eines Pfadsegments. Dies kann nicht Punkt für Punkt überprüft werden, da
dies eine unendlich große Anzahl von Aufrufen des Kollisionserkennungsal-
gorithmus erfordern würde.
Angenommen, ein Pfad τ : [0,1]→ C muss geprüft werden, um festzustel-
len, ob τ([0,1]) ⊂ C f ree. Ein üblicher Ansatz besteht darin, das Intervall [0,1]
stichprobenartig abzutasten und die Kollisionserkennung nur für die Abtast-
werte aufzurufen. In der Praxis wird häufig als Auflösung der Abtastrate ein
festes ∆q > 0 als Schrittweite im Konfigurationsraum gewählt. Die Punkte
t1, t2 ∈ [0,1] werden so gewählt, dass sie nahe genug beieinander liegen, um
sicherzustellen, dass ρ(τ(t1),τ(t2)) ≥ ∆q ist, wobei ρ eine Metrik auf C ist.
Der Wert von ∆q wird oft experimentell bestimmt. Ist ∆q zu klein, wird viel
Zeit mit der Kollisionserkennung vergeudet. Wenn ∆q zu groß ist, besteht
die Möglichkeit, dass ein dünnes Hindernis auf dem Pfad nicht erkannt wird
(vgl. [LaV06] S. 214).
2.4.4 Zeitabhängige Bewegungsplanung
Bislang wurde das Problem der Bewegungsplanung in dieser Arbeit zeitlich
unabhängig betrachtet und davon ausgegangen, dass sich genau ein Objekt
im Weltmodell bewegt und alle anderen Objekte stationär die Hindernisregi-
on O bilden. Wenn jedoch von einem dynamischen Weltmodell ausgegangen
wird, in dem Objekte über die Zeit ihren Standort verändern, dann entsteht
eine neue Komplexität in der Bewegungsplanung. Das Hinzuziehen der Zeit
ermöglicht die Betrachtung kinodynamischer Eigenschaften wie Geschwin-
digkeit und Beschleunigung sowie die Koordination der Bewegungsplanung
für mehr als ein Objekt.
Formale Problemstellung zeitabhängiger Bewegungsplanung
Sei T ⊂R ein Zeitintervall, das beschränkt als T = [0, t f ] und unbeschränkt als
T = [0,∞) geschrieben werden kann. Dabei ist 0 der Initialzeitpunkt und t f
der Endzeitpunkt im beschränkten Fall.
Sei der Zustandsraum Z als Z = C × T definiert, wobei C der Konfigurati-
onsraum eines bewegten Objekts wie in Abschnitt 2.4.3 beschrieben ist. Ein
48 2 Grundlagen
Zustand z wird als Zustandsvektor z = (q, t) repräsentiert und besteht aus
einer Konfiguration q und einem Zeitpunkt t als Komponenten. Die Beson-
derheit der Zeit ist, dass sie immer voranschreitet. Daher sind insbesondere
die Pfade in Z gezwungen, sich in der Zeit vorwärts zu bewegen. Im Folgen-
den soll die formale Problemstellung aus Abschnitt 2.4.3 als zeitabhängige
Version dargestellt werden. Die Komponenten können wie folgt aufgelistet
werden:
• ein WeltmodellW = R2
• ein Zeitintervall T = [0, t f ] oder T = [0,∞)
• eine Hindernisregion O(t) ⊂W für jedes t ∈ T
Es wird angenommen, dass die Hindernisregion eine endliche Menge
starrer Körper ist, die kontinuierlichen, zeitabhängigen Transformationen
unterliegt.
• ein bewegtes Objekt A und sein Konfigurationsraum C
• der ZustandsraumZ als kartesisches ProduktZ = C ×T und ein Zustand
z, der als Zustandsvektor z = (q, t) repräsentiert wird und aus einer
Konfiguration q und einem Zeitpunkt t besteht
• eine Hindernisregion Zobs innerhalb des Zustandsraums definiert als
Zobs = {(q, t) ∈ Z | A(q) ∩O(t) 6= ∅}
• ein freier Raum Z f ree = Z\Zobs innerhalb des Zustandsraums
• Cobs(t) und C f ree(t) für jedes t∈ Tmit Cobs(t) = {q∈ C | A(q)∩O(t) 6= ∅}
und C f ree = C\Cobs
• ein Initialzustand zi ∈ Z f ree mit zi = (qi,0) für eine qi ∈ C f ree(0)
• eine stationäre Zielkonfiguration qg ∈ C, die als Zielregion Zg ⊂ Z f ree
abgebildet ist, wobei Zg = {(qg, t) ∈ Z f ree | t ∈ T}
Ein vollständiger Algorithmus muss einen kontinuierlichen, zeitlich mono-
tonen Pfad τ[0,1]→Z f ree berechnen, so dass τ(0) = zi und τ(1) ∈ Zg, oder
korrekt zurückgeben, dass solch ein Pfad nicht existiert. Die zeitliche Mo-
notonie impliziert für jedes Paar s1, s2 ∈ [0,1] mit s1 < s2, dass t1 < t2 und
τ(s1) = (q1, t1) sowie τ(s2) = (q2, t2).
In der allgemeinen Problemstellung für zeitabhängige Bewegungsplanung
gibt es keine zusätzlichen Beschränkungen für den Pfad τ, was bedeutet,
dass das Bewegungsmodell unendliche Beschleunigung und unbegrenzte
Geschwindigkeit für Objekte zulässt. Die Geschwindigkeit kann sich augen-
blicklich ändern, aber der Weg durch C muss immer kontinuierlich sein.
Stückweise lineare Bewegung Ein für diese Arbeit relevantes Beispiel für
die Art und Weise, wie eine zeitabhängige Bewegungsplanung umgesetzt
werden kann, ist die Verwendung eines stückweise linearen Bewegungsmodells,
2.4 Planung und Verwaltung von Objektbewegungen 49
bei dem die Transformationen von A und O auf Basis einer stückweise linea-
ren Funktion der Zeit durchgeführt werden. Da es sich um ein lineares Bewe-
gungsmodell handelt, wird ein Punkt (x,y) durch (x+ c1t,y+ c2t)mit den
Konstanten c1, c2 ∈R transformiert. Bei einer stückweise linearen Funktion
können die Konstanten zu einer endlichen Anzahl an kritischen Zeitpunkten
geändert werden. Zwischen diesen Zeitpunkten bleibt die Funktion linear
(vgl. [LaV06] S. 314).
Trennung von Bahnplanung und Bewegungssteuerung
Für das in dieser Arbeit entwickelte Verfahren soll als Grundlage dieMethode
der Geschwindigkeitsanpassung (engl. velocity tuning) beschrieben werden.
Die Grundidee besteht darin, die Lösung der Problemstellung in C × T in die
Bahnplanung und die zeitliche Bewegungsplanung aufzuteilen.
Dabei wird davon ausgegangen, dass es stationäre Hindernisse gibt, die
durch einen geplanten Pfad τ : [0,1]→C f ree umgangen werden. Dazu werden
in der ersten Phase die klassischenMethoden der Bahnplanung ohne zeitliche
Abhängigkeiten verwendet.
Die zeitliche Bewegungsplanung wird in der zweiten Phase auf den neu
generierten Pfad angewandt. Dies geschieht durch den Entwurf einer Zeit-
steuerungsfunktion σ : T→ [0,1], die für jede Zeit t die Position des bewegten
Objekts A auf dem Pfad τ beschreibt. Dies wird durch eine Komposition
φ = τ ◦ σ erreicht, die T über [0,1] nach C f ree abbildet. Daher ist φ : T→ C f ree.
Die Konfiguration zum Zeitpunkt t ∈ T ist durch φ(t) = τ(σ(t)) gegeben
(vgl. [LaV06] S. 317).
Sei S = [0,1] der Definitionsbereich von τ. Dann kann ein Zustandsraum
Z = T × S definiert werden, in dem jeder Punkt (t, s) einen Zeitpunkt t ∈ T
und eine Position s ∈ [0,1] auf dem Pfad indiziert. Die Hindernisregion wird
wie folgt definiert:
Zobs = {(t, s) ∈ Z | A(τ(s)) ∩O(t) 6= ∅}.
Der freie Raum ist als Z f ree = Z\Zobs definiert. Die Planungsaufgabe für die
Bewegungssteuerung besteht darin, einen kontinuierlichen Pfad g : [0,1]→
Z f ree zu finden (vgl. [LaV06] S. 318).
2.4.5 Bewegungsplanung für mehrere Objekte
Die Planung der Bewegung mehrerer Objekte in einer WeltW erfordert nicht
nur die Vermeidung von Kollisionen mit der Hindernisregion O, sondern
auch die Koordination einer kollisionsfreien Bewegung der Objekte unter-
einander. Angenommen, es soll die Bewegung von m Objekten A1, . . . ,Am
geplant werden. Dann hat jedes Objekt Ai einen assoziierten Konfigurations-
raum C i und jeweils eine eigene Initialkonfiguration qiinit und Zielkonfigura-
50 2 Grundlagen
tion qiziel .
Formale Problemstellung Der Zustandsraum wird so definiert, dass er die
Konfigurationen aller bewegten Objekte gleichzeitig abbildet:
Z = C1 × C2 × · · · × Cm.
Ein Zustand z ∈ Z beinhaltet die Konfiguration aller Objekte und kann
als z = (q1,q2, . . . ,qm) geschrieben werden. Die Dimension von Z ist durch
N = ∑mi=1 dim(C i) gegeben.
Es gibt zwei Hindernisregionen im Zustandsraum: Die eine entsteht durch
die Kollisionen mit statischen Objekten und die andere entsteht mit anderen
bewegten Objekten. Für die Kollisionen mit statischen Objekten wird die
Hindernisregion für jedes Objekt Ai bei 1≤ i ≤ m durch die Untermenge
Z iobs = {x ∈ Z | A
i(qi) ∩O 6= ∅}
definiert. Für die Definition der Hindernisregion zwischen den bewegten
Objekten kann für jedes Paar Ai und Aj die Untermenge
ij
Zobs = {z ∈Z | A
i(qi) ∩Aj(qj) 6= ∅}
definiert werden. Beide Formeln werden in der folgenden formalen Beschrei-
bung der Problemstellung für die Bewegungsplanung mehrerer Objekte
kombiniert (vgl. [LaV06] S. 319):
• ein WeltmodellW = R2
• eine Hindernisregion O ⊂W
• die bewegten Objekte A1, . . . ,Am
• ein Konfigurationsraum C i mit i von 1 bis m für jedes bewegte Objekt
• ein ZustandsraumZ , der als kartesisches ProduktZ = C1×C2× · · ·×Cm
definiert ist
• eine Hindernisregion in Z(, die als⋃ )⋃ m ⋃
Z = Z iobs obs Z ij obs
i=1 ij, i 6=j
definiert wird
Dabei sind Z i und Z ijobs obs jeweils die einzelnen Hindernisregionen für
statische und bewegte Objekte
• der freie Zustandsraum Z f ree = Z\Zobs
• ein Initialzustand Zinit ∈ Z f ree, der die Initialkonfigurationen zinit =
(q1init, . . . ,q
m
init) aller bewegten Objekte beinhaltet
2.4 Planung und Verwaltung von Objektbewegungen 51
• ein Zielzustand zziel inZ f ree, der die Zielkonfigurationen
zziel = (q1ziel , . . . ,q
m
ziel) aller bewegten Objekte beinhaltet
Die Planungsaufgabe besteht darin, dass ein kontinuierlicher Pfad τ : [0,1]→
Z f ree berechnet werden muss, so dass τ(0) = zinit und τ(1) ∈ zziel . Dabei
beinhaltet dieser Pfad durch die besondere Konstruktion vonZ alle einzelnen
Pfade im freien Raum aller bewegten Objekte.
Durch diese formal einfache Darstellung wirkt die Problemstellung ähn-
lich wie die für ein einzelnes bewegtes Objekt. Jedoch wächst die Dimension
von Z linear mit der Anzahl der bewegten Objekte, während ein vollständi-
ger Algorithmus zur Lösung der Problemstellung im besten Fall eine expo-
nentielle Laufzeit erreichen kann. Selbst für viele stichprobenbasierte Algo-
rithmen kann die Dimension bei vielen Objekten in der Praxis ein Problem
darstellen (vgl. [LaV06] S. 320).
Entkoppelte und priorisierte Planung
Das Konzept der sogenannten entkoppelten Planung unterteilt die Problem-
lösung in mehrere Phasen. Zuerst werden die Bewegungen für die einzel-
nen Objekte entworfen, wobei die Interaktionen zwischen den bewegten
Objekten zunächst ignoriert werden. In der nächsten Phase werden diese
Wechselwirkungen berücksichtigt, jedoch sind die Wahlmöglichkeiten für
den Algorithmus durch die bereits entworfenen Pfade eingeschränkt. Übli-
cherweise können Entscheidungen aus der ersten Phase in der zweiten Phase
nicht mehr rückgängig gemacht werden. Daher geht die Vollständigkeit des
Algorithmus in der Regel verloren. Dennoch liefert die entkoppelte Planung
in der praktischen Anwendung gute Ergebnisse, und in einigen Fällen kann
die Vollständigkeit wiederhergestellt werden (vgl. [LaV06] S. 322).
Ein einfacher Ansatz für eine entkoppelte Planung besteht darin, die
bewegten Objekte nach Priorität zu sortieren und die Objekte mit höherer
Priorität zuerst einzeln zu planen. Dieser Ansatz der priorisierten Planung
geht davon aus, dass die Planung für ein Objekt mit niedriger Priorität alle
Objekte mit höherer Priorität als sich bewegende Hindernisse ansieht.
Angenommen, die bewegten Objekte sind durch ihre Indizes in abstei-
gender Reihenfolge durch A1, . . . ,Am sortiert. Der Ansatz der prioritären
Planung geht induktiv wie folgt vor:
• Induktionsanfang: Für das erste Objekt A1 wird mit einem der klassi-
schen Algorithmen ein kollisionsfreier Pfad τ : [0,1]→ C11 f ree berechnet.
Anschließend wird eine Zeitsteuerungsfunktion σ1 bestimmt, sodass
φ1 = τ1 ◦ σ1 : T→ C1f ree berechnet werden kann.
• Induktionsschritt: Angenommen, es wurden bereits die Wegzeitfunk-
tionen φ1, . . .φi−1 für die Objekte A1, . . . ,Ai−1 bestimmt, sodass keine
Kollisionen zwischen den Objekten entstehen. Für jedes t ∈ T und
52 2 Grundlagen
j ∈ {1, . . . , i− 1} können die Belegungen imWeltmodell Aj(φj(t)) ⊂W
bestimmt werden, die als Untermenge der Hindernisregion O(t) angese-
hen werden können. Auf dieser Basis werden für das ObjektAi ein neuer
kollisionsfreier Pfad τi und eine Zeitsteuerungsfunktion σi berechnet, die
zusammen φi = τi ◦ σi bilden.
Dieser Ansatz ist nach LaValle in der Praxis erfolgreich, jedoch muss für
dieses Verfahren der Verlust der Vollständigkeit des Lösungsraums in Kauf
genommen werden (vgl. [LaV06] S. 322).
Vorgeplante, festgelegte Pfade und der Koordinationsraum Ein besonde-
rer Fall der priorisierten Planung ist, in der ersten Phase alle Pfade τ1, . . . ,τm
zu planen und in der zweiten Phase in jedem Induktionsschritt eine Ge-
schwindigkeitsanpassung durch die Bestimmung der Zeitsteuerungsfunkti-
on σi vorzunehmen. Diese Vorgehensweise schränkt die Wahlmöglichkeiten
zur Lösungsfindung weiter ein, aber erzeugt ein 2D-Planungsproblem, das
einfach zu lösen ist (vgl. [LaV06] S. 322).
Die grundlegende Idee der festgelegten Pfade, die unabhängig von der
Geschwindigkeitssteuerung bestimmt werden, wirdmit demKonzept des Ko-
ordinationsraums weiterentwickelt. Da der eigentliche Konfliktbereich zweier
Objekte zylinderförmig und örtlich begrenzt ist, können mit stichproben-
basierten Algorithmen in der Praxis gute Ergebnisse erzielt werden. Eine
einfache Methode ist die Verwendung einer gitterbasierten Datenstruktur,
um die Suche nach Konfliktbereichen zu unterstützen (vgl. [LaV06] S. 325).
Festgelegte Straßenkarten und die sichereGaragenkonfiguration Einewei-
tere Spezialisierung der festgelegten Pfade ist die Verwendung einer Straßen-
karte oder eines topologischen Graphen. Hier kann die einfache Wegfindung
über klassische Verfahren wie den Algorithmus von Dijkstra erfolgen. Der
resultierende Koordinationsraum ist dann für jedes Objekt eindimensional,
da auf den gefundenen kürzesten Pfad begrenzt. Hier ist nicht mehr die
Wegfindung das Planungsproblem, sondern die Koordination steht im Fokus
der Problembetrachtung.
Ein Weg zu einem vollständigen Algorithmus ist die Einführung des Kon-
zepts der sicheren Garagenkonfiguration qi für jedes bewegte Objekt Ai, in der
eine Kollision mit anderen Objekten ausgeschlossen werden kann. Wenn qi
von jedem Initialzustand zinit erreichbar ist und als Zielkonfiguration ver-
wendet wird, dann kann ein vollständiger Planungsalgorithmus entwickelt
werden (vgl. [LaV06] S. 325).
2.4.6 Planung unter differenziellen Zwangsbedingungen
Bei der vorangegangenen Betrachtung der Bewegungsplanung wurde davon
ausgegangen, dass ein Weg zwischen zwei beliebigen Konfigurationen ohne
2.4 Planung und Verwaltung von Objektbewegungen 53
Hindernisse einfach ermittelt werden kann. Der auf Stichproben basierende
Ansatz, der Straßenkarten verwendet, geht beispielsweise davon aus, dass
zwei nahe zueinander gelegene Konfigurationen im Konfigurationsraum
direkt miteinander verbunden werden können. Solche Pfadbeschränkungen
sind global in dem Sinne, dass sie sich nur auf die Menge der zulässigen
Konfigurationen beziehen, die den freien Konfigurationsraum bilden.
Differenzielle Zwangsbedingungen treten grundsätzlich überall dort auf,
wo sich physische Objekte bewegen. Sie ergeben sich aus der Kinematik und
Dynamik eines mechanischen Systems und führen dazu, dass die zulässigen
Geschwindigkeiten an jedem Punkt lokal begrenzt sind.
Ein gängiger Ansatz besteht darin, sie bei der Bewegungsplanung einfach
zu ignorieren und zu hoffen, dass untergeordnete Steuerungstechniken sie
so handhaben können, dass ein berechneter Pfad dennoch so genau wie
möglich ausgeführt wird. Ein besserer, aber aufwändigerer Ansatz besteht
darin, differenzielle Beschränkungen in den Entwurfsprozess einzubeziehen,
damit die berechneten Bahnen den natürlichen Bewegungsmöglichkeiten
eines mechanischen Systems entsprechen (vgl. [LaV06] S. 713).
Differenzielle ModellierungModelle mit differenziellen Randbedingungen
werden im Allgemeinen über
ż = f (z,u)
dargestellt. Dies ist das zeitkontinuierliche Gegenstück zur Zustandsüber-
gangsfunktion zk+1 = f (zk,uk). Im Unterschied zur diskreten Version der
Funktion liefert f (z,u) im zeitkontinuierlichen Fall einen Geschwindigkeits-
vektor und nicht den nächsten Zustand. Da die Zustandsübergänge nicht
diskret betrachtet werden können, wird ein zukünftiger Zustand, der dif-
ferenziellen Zwangsbedingungen genügt, über die Ableitung nach dem
Geschwindigkeitsvektor erzeugt. Daher ist es naheliegend, nur Geschwin-
digkeiten anzugeben. Dies beruht auf den Konzepten der Tangentenräume
und Vektorfelder (vgl. [LaV06] S. 715).
Ein für diese Arbeit relevantes Beispiel für einen solchen Tangentenraum
kann für die Annahme C = R2 gegeben werden. Eine Konfiguration wird als
q = (x,y) ∈R2 geschrieben, während ein Geschwindigkeitsvektor als (ẋ, ẏ)
ausgedrückt wird. Jedes (ẋ, ẏ) ist Element des Tangentenraums T (R2q ), der
als zweidimensionaler Vektorraum an jedem Punkt (x,y) ∈R2 definiert ist.
Zu Abbildung der Zwangsbedingungen wird für jedes q ∈R2 die Menge der
gültigen Geschwindigkeitsvektoren U(q) ⊂ T 2q(R ) gebildet (vgl. [LaV06] S.
716).
Damit das mathematische Konzept der Ableitung nach Position und Zeit
im Allgemeinen möglich wird, ist es erforderlich, dass C nicht nur eine to-
pologische Mannigfaltigkeit, sondern darüber hinaus auch eine sogenannte
54 2 Grundlagen
differenzierbare Mannigfaltigkeit ist und sich lokal wie ein euklidischer Raum
verhält (vgl. [LaV06] S. 716). Damit ergibt sich die Verbindung zur klassischen
Mechanik und ihren Teilgebieten. Zur Bewegungsplanung können Modelle
der Newtonschen Mechanik, des Lagrange-Formalismus und der Hamil-
tonschen Mechanik (z. B. chaotische Bewegung von Partikeln) verwendet
werden.
Aus der Hamiltonschen Mechanik stammt das Konzept des Phasenraums,
das dazu genutzt werden kann, Zwangsbedingungen für Ableitungen hö-
herer Ordnung (Beschleunigung, Ruck usw.) auf die Ableitung erster Ord-
nung, also Beschränkungen der Geschwindigkeit zu reduzieren. Dies wird
allerdings durch eine erhöhte Dimension des Zustandsraums erkauft (vgl.
[LaV06] S. 715). Das spezifische Konzept der Nutzung von Geschwindigkeits-
beschränkungen als Ersatz für Zwangsbedingungen der Beschleunigung
wird in dieser Arbeit verwendet.
Stichprobengestützte Planung unter differenziellen
Zwangsbedingungen
Laut LaValle gibt es im Allgemeinen keine kombinatorischen Ansätze für
Modelle mit differenziellen Zwangsbedingungen, sodass entsprechende Al-
gorithmen nur in äußerst begrenzten Fällen existieren. Modellen mit diffe-
renziellen Zwangsbedingungen fehlen die meisten der nützlichen mathema-
tischen Eigenschaften, die für kombinatorische Ansätze erforderlich sind.
Grundsätzlich wird die Entwicklung von Algorithmen durch die Diskretisie-
rung von drei Räumen (Zustandsraum, Aktionsraum und Zeit) erschwert
(vgl. [LaV06] S. 713).
Daher sollen in diesem Abschnitt einige Grundlagen und Methoden der
stichprobengestützten Bewegungsplanung vorgestellt werden, die differen-
zielle Zwangsbedingungen ermöglichen. Dabei werden die Unterschiede
und Gemeinsamkeiten zwischen den Begriffen der kinodynamischen Planung
und der Trajektorienplanung vorgestellt. Der in der Literatur wichtige Fall der
nicht-holonomischen Planung wird im Rahmen dieser Arbeit nicht weiter
verfolgt und daher hier nicht vorgestellt (vgl. [LaV06] S. 787).
Formale Problemstellung Es wird angenommen, dass die differenziellen
Zwangsbedingungen in einer Zustandsübergangsgleichung ż = f (z,u) auf
einer differenzierbaren Mannigfaltigkeit Z , dem Zustandsraum, ausgedrückt
werden, der ein Konfigurationsraum C oder ein Phasenraum eines Konfigu-
rationsraums sein kann. Eine Lösung wird nicht direkt als Pfad ausgedrückt,
sondern durch Integration der Zustandsübergangsgleichung aus einer Akti-
onstrajektorie abgeleitet.
Die Aktionstrajektorie basiert für den allgemeinen Fall auf dem Aktions-
raum U ⊂ Rm. Ein Planungsalgorithmus berechnet die Aktionstrajektorie
ũ, die über die Funktion ũ : [0,∞)→ U definiert ist. Eine einzelne Aktion
2.4 Planung und Verwaltung von Objektbewegungen 55
am Zeitpunkt t wird durch u(t) ∈U(z(t)) ⊂U ausgedrückt, womit die Ab-
hängigkeit der möglichen Aktionen vom Zustandsraum abgebildet wird. Es
wird angenommen, dass eine terminierende Aktion uT verwendet wird, die
zu einem Zeitpunkt tF angewendet wird.
Die Verbindung zwischen Aktions- und Zustandsraum wird durch folgen-
de Definition einer Zustandstrajektor∫ie geschaffen:t
z(t) = z(0) + f (z(t′),u(t′))dt′
0
integriert die Zustandsübergangsgleichung ż = f (z,u) aus dem Initialzu-
stand z(0). Mit z̃(z(0), ũ) sei die Zustandstrajektorie über alle Zeiten definiert.
Wenn u für jede Zeit t festgelegt ist, dann definiert ż = f (z,u) ein statisches
Vektorfeld (vgl. [LaV06] S. 789).
Die formale Problemstellung lässt sich aus den vorherigen Problemstellun-
gen in den Unterabschnitten Abschnitt 2.4.3 und Abschnitt 2.4.4 kombinieren
und erweitern:
• ein WeltmodellW ∈R2
• ein bewegtes Objekt A
• eine Hindernisregion O ⊂W
• ein Konfigurationsraum C
• ein unbegrenztes Zeitintervall T = [0,∞)
• ein Zustandsraum Z , der als differenzierbare Mannigfaltigkeit definiert
ist und der Z = C oder als abgeleiteter Phasenraum von C definiert
werden kann
• eine Hindernisregion Zobs und der freie Zustandsraum Z f ree = Z\Zobs,
der alle Zustände enthält, die Kollisionen vermeiden und alle Zwangsbe-
dingungen einhalten
• Für jeden Zustand z ∈ Z gibt es einen beschränkten Aktionsraum
U(z) ⊆Rm ∪ {uT}mit m als feste Anzahl an Aktionsvariablen und uT als
Terminierungsaktion. Sei U die Vereinigung aller U(z) über alle z ∈ Z .
• eine Zustandsübergangsgleichung ż = f (z,u), die für alle z ∈ Z und
u ∈U(z) definiert ist
• ein Initialzustand zI ∈ Z f ree
• eine Zielmenge ZG ⊂ Z f ree
Ein vollständiger Algorithmus berechnet eine Aktionstrajektorie ũ : T→U,
aus der eine Zustandstrajektorie z̃ gebildet werden kann, bei der z(0) = zI
ist, für die ein t > 0 mit u(t) = uT existiert und für die es ein z(t) ∈ ZG gibt
(vgl. [LaV06] S. 790).
Eine formale Besonderheit in dieser Problemstellung ist die Verwendung
der Terminierungsaktion uT . Sobald sie ausgeführt wird, bleibt der erreichte
56 2 Grundlagen
Zustand unverändert. Dabei wird angenommen, dass die Geschwindigkeits-
vektoren in ZG null sind, sodass das physische Objekt nach Durchführung
der Bewegung in dieser Endposition verbleibt.
KomplexitätDie Bewegungsplanung unter differenziellen Zwangsbedingun-
gen gilt als extrem schwierige Problemstellung (vgl. [LaV06] S. 790). Schon
die Standardproblemstellung aus Abschnitt 2.4.3 ist PSPACE-hart. Daher
sind die überwiegenden praktisch anwendbaren Lösungsansätze stichpro-
benbasiert.
Region der unvermeidlichen Kollision
Ein große Herausforderung bei der Bewegungsplanung von hochdynami-
schen Systemen ist die Berücksichtigung der sogenannten Region der un-
vermeidlichen Kollision (engl. region of inevitable collision, RIC). Diese ist
definiert als die Menge von Zuständen Zric, aus denen heraus ein Eintritt
in die Hindernisregion Zobs unvermeidlich ist. Wenn sich ein Objekt mit
hoher Geschwindigkeit auf ein Hindernis zubewegt, dann wird ab einem
Punkt eine Kollision eintreten, unabhängig davon, ob Brems- oder Ausweich-
manöver eingeleitet werden. Bei sehr geringen Geschwindigkeiten sind in
der Praxis Zric und Zobs ungefähr deckungsgleich, da ein Objekt in jedem
Fall schnell genug zum Stillstand gebracht werden kann. Bei steigenden
Geschwindigkeiten wächst Zric jedoch dramatisch an (vgl. [LaV06] S. 796).
Kinodynamische Planung und Trajektorienplanung
Der Begriff der kinodynamischen Planung bezieht sich auf Planungsprobleme,
für die Geschwindigkeits- und Beschleunigungsgrenzen eingehalten wer-
den müssen. Es handelt sich hierbei um Zwangsbedingungen der zweiten
Ordnung auf dem Konfigurationsraum C. Der Begriff der Trajektorienplanung
wird häufig synonym zur kinodynamischen Planung verwendet. Historisch
gesehen verbindet sich mit der Trajektorienplanung ein Ansatz der entkop-
pelten Planung, bei dem zuerst ein Pfad durch C f ree geplant wird, für den
anschließend ein Geschwindigkeitsprofil erstellt wird, das den Zwangsbe-
dingungen genügt (vgl. [LaV06] S. 792).
Entkoppelte Trajektorienplanung
Schon bei der Betrachtung einfacher dynamischer Plaungsprobleme in Ab-
schnitt 2.4.4 und bei der Planung für mehrere Objekte in Abschnitt 2.4.5
wurde die entkoppelte Planung besprochen. Auch wenn sich die Möglichkei-
ten moderner Hardware für den Einsatz ganzheitlicher Planungsalgorithmen
eignen, kann ein entkoppelter Einsatz notwendig werden, wenn Lösungen
durch aufwändige numerische Integration, Kollisionserkennung oder hoch-
dimensionale Hindernisregionen zu rechenintensiv werden (vgl. [LaV06] S.
841).
2.4 Planung und Verwaltung von Objektbewegungen 57
Idealerweise ist das Ziel einer Methode die Erstellung eines Bewegungs-
plans, der durch eine Regelungseinrichtung direkt ausgeführt werden kann
und dabei Hindernisse vermeidet und differenzielle Zwangsbedingungen
einhält. Eine besondere Annahme dabei ist, dass der tatsächliche Zustand
eines bewegten Objekts zuverlässig und genau gemessen werden kann. Eine
typische Vorgehensweise für einen entkoppelten Ansatz wird nach LaValle
in vier unterschiedliche Module unterteilt:
• Verwende einen einfachen Planungsalgorithmus zur Bestimmung eines
kollisionsfreien Pfades τ : [0,1]→ C f ree.
• Transformiere τ in einen neuen Pfad τ′, der die differenziellen Zwangs-
bedingungen besser erfüllt. Dies kann beispielsweise durch eine Pfad-
glättung erfolgen.
• Berechne eine Zeitsteuerungsfunktion σ : [0, tF]→ [0,1] für τ′, sodass
τ′ ◦ σ einen zeitparametrisierten Pfad durch C f ree bilden. Dieser Pfad
muss den Anforderungen an die Zustandstrajektorie z̃ genügen und
ż= F(z(t),u(t)) sowie u(t) ∈U(z(t)) für alle Zeitpunkte erfüllen, bis die
terminierende Aktion uT zum Endzeitpunkt tF ausgeführt wird.
• Entwirf eine Regeleinrichtung π : Z →U, die den Verlauf der geplanten
Zustandstrajektorie z̃ in der physischen Realität mit möglichst geringem
Fehler nachzubilden versucht.
Durch diese Form der Entkopplung wird eine Dekomposition der Problem-
stellung erreicht, die in der Praxis zu großen Einsparungen im Berechnungs-
aufwand führen kann. Dies wird durch den Verlust der Vollständigkeit des
Algorithmus erkauft, da nachteilige Entscheidungen in einem Modul in
nachfolgenden Modulen zu unvorteilhaften Lösungen führen können (vgl.
[LaV06] S. 841).
Pfadbeschränkte Trajektorienplanung
Angenommen, es existiert bereits ein geglätteter Pfad τ′ : [0,1]→ C f ree, der
auf einem Pfad τ basiert, der durch einen Algorithmus berechnet oder per
Hand gestaltet wurde. Das Ziel ist nun, eine Zustandstrajektorie z̃ zu bestim-
men, die als Führungsgröße einer Regeleinrichtung dienen kann, wie sie in
Abschnitt 2.1 für die Steuerung logistischer Systeme beschrieben wurde. Die
dazugehörige Aufgabe ist die Bestimmung eines Geschwindigkeitsprofils
entlang des Pfades, das die differenziellen Zwangsbedingungen im Zustands-
raum Z einhält. Angenommen, dass jeder Zustand z ∈ Z eine Konfiguration
in C sowie ihre zeitliche Ableitung repräsentiert, sodass z = (q, (̇q)). Wenn n
die Dimension von C ist, dann hat Z entsprechend die Dimension 2n (vgl.
[LaV06] S. 846).
Sobald ein Pfad gegeben ist, können die Freiheitsgrade für die weitere
Bewegungsplanung beschränkt werden, z. B. mit:
58 2 Grundlagen
• die Position s ∈ [0,1] entlang des Pfades
• die Geschwindigkeit ṡ = dsdt an jedem Punkt s
Der vollständige Zustand z ∈ Z lässt sich aus s und ṡ rekonstruieren. Aus
dieser Vorgehensweise heraus ergibt sich ein zweidimensionales Planungs-
problem, bei dem alle Zustandsänderungen die Zwangsbedingungen der
Gleichung ż = f (z,u) erfüllen müssen. Für die effiziente Lösung dieses Pro-
blems gibt es zahlreiche Methoden, von denen viele ursprünglich für Robo-
terarme entwickelt wurden (vgl. [LaV06] S. 846). Für die Betrachtung aller
differenziellen Zwangsbedingungen im Konfigurationsraum C kann eine
Gleichung in der folgenden Form aufgestellt werden:
q̈ = h(q, q̇,u).
Dabei sind n Aktionsvariablen u = (u1, . . . ,un) berücksichtigt. Die Beschleu-
nigung in C ist vom Zustand z = (q, q̇) und der Aktion u abhängig. Das
bewegte Objekt wird dabei als holonomisch angenommen und hat genug
Freiheitsgrade, um einem spezifizierten Pfad zu folgen. LaValle zeigt, dass
es möglich ist, die obige Gleichung mit den Positionen s auf dem Pfad und
ihren Ableitungen ersten und zweiten Grades ṡ und s̈ in Beziehung zu setzen
(vgl. [LaV06] S. 847ff). Dabei wird die Funktion h′(s, ṡ,u) definiert und als
Gleichung
q̈ = h′(s, ṡ,u)
geschrieben, wobei der einzige Unterschied zur vorherigen Gleichung ist,
dass z = (q, q̇) auf eine Untermenge von Z beschränkt ist, die durch An-
wendung von Werten für s und ṡ erreicht werden können. Die Menge an
möglichen Beschleunigungsvektoren, die durch u erreicht werden können,
bleibt prinzipiell gleich. LaValle zeigt, dass für jedes ui mit i ∈ {1, . . . ,n} eine
Zwangsbedingung in der Form
1 d2τ
s̈ = h′i(s, ṡ,ui)−
i ṡ22 (2.1)dτi/ds ds
durch Auflösung nach s̈ erzeugt wird, sofern dτi/ds 6= 0 (vgl. [LaV06] S. 848).
Eine Aktion u ∈ U führt nur dann dazu, dass dem Pfad τ gefolgt wird,
wenn alle n Zwangsbedingungen basierend auf Gleichung 2.1 erfüllt sind.
Aus diesemGrund sind alle Aktionen, die τ folgen, in einer eindimensionalen
Untermenge vonU enthalten, da bei Wahl eines ui alle anderen n− 2 Aktions-
variablen über Auflösung der ersten Gleichung nach s̈ und anschließendes
Einsetzen bestimmt werden.
Durch diese gegenseitige Abhängigkeit der Aktionsvariablen (u1, . . . ,un)
können unter Umständen viele Fälle auftreten, in denen aus einem Zustand
z keine geeigneten Aktionen u ∈U existieren, die zu einem korrekten Folgen
2.4 Planung und Verwaltung von Objektbewegungen 59
von τ führen. Durch das Einführen von geeigneten Zwangsbedingungen
auf Z können solche Zustände ausgeschlossen werden (wie z. B. durch eine
erlaubte Höchstgeschwindigkeit). Auch durch eine ungeeignete Wahl von τ
können Fälle generiert werden, die dazu führen, dass ein Folgen des Pfades
unmöglich wird.
Abb. 2.16 Ein ungünstig gewählter Pfad für die pfadbeschränkte Trajektorienplanung
Abbildung 2.16 zeigt einen ungünstig gewählten Pfad τ. An der Position
τ(1/3) erreicht er eine Ecke, die dazu führt, dass τ nicht differenzierbar ist.
Je nach Bewegungsmodell kann es unmöglich sein, an dieser Stelle dem Pfad
zu folgen. Für holonomische Bewegungsmodelle ist es möglich, an dieser
Stelle die Geschwindigkeit bis auf den Wert null zu reduzieren und dann
wieder neu zu starten. Grundsätzlich ist es vorteilhaft, den Pfad in weichen
Kurven zu führen, wobei eine sehr enge Kurve, wie sie in der Abbildung an
Position τ(2/3) abgebildet ist, aufgrund der starken Krümmung zu einer
niedrigen Geschwindigkeit führt, damit die Zentripetalbeschleunigung nicht
zu hoch wird.
Sieht man von dem Problem der schlecht gewählten Pfade ab, dann kann
die Erzeugung eines optimalen Geschwindigkeitprofils effizient erfolgen.
LaValle zeigt eine Mögllichkeit der Verwendung von dynamischer Program-
mierung und, für die vorliegende Arbeit von Bedeutung, den zeitoptimalen
Ansatz der sogenannten Bang-Bang-Methode. Die grundsätzliche Idee ist es,
das Geschwindigkeitsprofil aus einer Sequenz der Bewegungsprimitive der
maximalen Beschleunigung und der maximalen Verzögerung zu erzeugen
(vgl. [LaV06] S. 852ff).

Kapitel 3
Axiomatik der Logistik
Zusammenfassung Das dritte Kapitel bildet die Grundlage für die Identi-
fizierung der Forschungslücke, die mit dieser Arbeit geschlossen wird. Es
wird eine Axiomatik der Logistik entwickelt, die Konzepte aus der Bewe-
gungsplanung der Robotik mit logistischen Fachbegriffen verbindet. Es wird
eine Neudefinition der Logistik auf Basis des Konzepts des logistischen
Raums hergeleitet. Aus der Axiomatik ergibt sich die mögliche Struktur
des logistischen Raums als Kontinuum zwischen einer gitterbasierten und
einer kontinuierlichen Abbildung. Der ideale logistische Raum wird als Ex-
tremwert einer kontinuierlichen Struktur identifiziert und semantisch dem
idealisierten Förderwesen zugeordnet. Eine gitterbasierte Struktur wird dem
idealisierten Lagerwesen zugeordnet. Anschließend wird das Konzept des
Cyberphysischen Zwillings als Verbindung zwischen cyberphysischen Syste-
men, Digitalem Zwilling und der Axiomatik der Logistik eingeführt.
61
62 3 Axiomatik der Logistik
3.1 Motivation für eine axiomatische Betrachtung
Das Unterfangen, eine allgemeingültige Axiomatik der Logistik aufzustel-
len, muss sich zunächst der Frage stellen, wozu es gebraucht wird, wenn es
bereits eine Vielzahl von Strukturierungsansätzen für die logistische Wirk-
lichkeit gibt, die ihre jeweilige nützliche Daseinsberechtigung führen (vgl.
Abschnitt 2.1). Eine zweite Frage ist, warum eine Dissertation über eine
Bewegungsplanung für Transportroboter an dieser Stelle der Arbeit – zwi-
schen Grundlagen und Bestimmung der Forschungslücke – eine Axiomatik
entwickelt.
Der Ausgangspunkt der Überlegungen zur Entwicklung einer Axiomatik
ist die intuitive Annahme, dass hinter den erfolgreichen Logistikanwendun-
gen, die auf gitterbasierten Bewegungen basieren (vgl. das AutoStore-System
in Abbildung 3.1a), ein grundlegendes Prinzip der Logistik steckt. Erweitert
werden diese Überlegungen durch die Existenz schwarmbasierter Systeme,
die sich frei bewegen können (vgl. das Loadrunner-System in Abbildung
3.1b) und ein Gegenbeispiel für ausschließlich gitterbasierte Bewegung zei-
gen. Diese und andere Beispiele für moderne Logistikanwendungen geben
jedoch nur Hinweise auf die mögliche Existenz grundlegender Prinzipien
der Logistik. Es fehlt eine grundlegende, anwendungsunabhängige Betrach-
tung, die Einzelproblemstellungen und Gesamtprobleme verbindet und den
beteiligten Disziplinen und Fachbereichen (z. B. Informatik, Statistik, Auto-
matisierungstechnik, Robotik) mit Vorgaben aus demGesamtzusammenhang
der Logistik zuweist. Bisher füllt die Logistikforschung diese Rolle nur be-
dingt. Vielmehr nimmt sie heutzutage die umgekehrte Synthesefunktion ein
und beschränkt sich häufig auf ihre Rolle als Anwendungsdomäne.
(a) (b)
Abb. 3.1 (a) Gitterbasierte Bewegung am Beispiel AutoStore1[FS21] (b) Freie Bewegung
am Beispiel des Loadrunners [ten+20]
Der Anspruch einer zeitgemäßen Dissertation in der Logistikforschung muss
es sein, dass sie die Herausforderungen und Probleme aus logistischer Sicht
modelliert und strukturiert. Dabei soll die Betrachtung der Einzelproblem-
1 Quelle:©c AutoStore
3.1 Motivation für eine axiomatische Betrachtung 63
stellungen der beteiligten Disziplinen und Fachbereiche (in diesem Fall vor
allem der Robotik) als Grundlage für eine übergeordnete Theorie der Logistik
genutzt werden. Dies wird durch die Entwicklung einer Axiomatik ermög-
licht. Die folgenden Annahmen werden in dieser Arbeit für den Entwurf der
Axiomatik verwendet:
• Ein logistisches Axiom ist ein intuitiv unmittelbar einleuchtender Grund-
satz, der als Prinzip für eine im praktischen Arbeitsleben empirisch gut
bestätigte Regel postuliert werden kann (nach dem klassischen und na-
turwissenschaftlichen Axiombegriff).
• In der Regel sind logistische Axiomensysteme evidenzbasiert und müs-
sen nicht formal vollständig sein.
• Ein logistisches Axiomensystem stellt die Grundlage für die Verkürzung
der Wirklichkeit zur Verfügung, nach der logistische Modelle erstellt
werden können.
• Der Wert eines logistischen Axiomensystems zeigt sich erst in der Praxis.
Es wird jedoch nicht die einzig allgemeingültige Axiomatik im Sinne der
Naturwissenschaften gesucht, sondern eine Axiomatik, die für die meisten lo-
gistischen Zielanwendungen einen hinreichenden Erkenntnisgewinn zulässt.
Daher wären die Newtonschen Axiome ein gutes Beispiel für ein einfaches
System, das hinreichend genau ist. Im Gegensatz dazu stehen Axiome der
speziellen Relativitätstheorie oder der Quantenmechanik, die genauer sind,
aber auch deutlich komplexer in ihrer Anwendung. Für die Logistik verhält
sich dieser Umstand etwas anders: Die Grundbegriffe sind trivial und allge-
mein bekannt, daher gibt es sie in vielen, leicht unterschiedlichen Stadien
der Formalisierung. Dies bedeutet, dass bereits eine Vielzahl von intuitiven,
klassischen Axiomensystemen für die Logistik existiert.
Im Grunde lernt jedes Kind die Grundlagen einer logistischen Struktu-
rierung des Raums anhand von Bauklötzen und anderem Spielzeug. Daher
ist der klassische Axiombegriff – das unmittelbar einleuchtende Prinzip –
für fast alle Menschen in logistisch wichtigen Angelegenheiten auf den ers-
ten Blick einfach einzusehen. Dasselbe gilt für den naturwissenschaftlichen
Axiombegriff, da die meisten logistischen Angelegenheiten alltäglich und
vielfach empirisch bestätigt werden.
Die offensichtliche Trivialität der anfänglich zu lösenden Problemstellun-
gen und die allgemeine Verbreitung logistischer Anwendungen sorgen dafür,
dass es eine große Zahl ähnlicher Axiomensysteme gibt, die in Software
realisiert wurden. Alleine im deutschsprachigen Raum gibt es mehr als 100
Anbieter von Lagerverwaltungssystemen (vgl. [Sch+20]), deren Softwarepro-
dukte im Grunde dieselbe logistische Problemstellung lösen. Die folgende
Definition eines Gesetzes soll diesen Umstand darstellen, der einen Aspekt
des Dilemmas der logistischen Standardisierung beschreibt.
64 3 Axiomatik der Logistik
Gesetz über die Langlebigkeit pragmatischer Belanglosigkeit
Je einfacher eine Sache von vielen Menschen beschrieben werden kann,
die für eine pragmatische und in kurzer Zeit zu lösende Problem-
stellung notwendig, aber nicht wichtig ist, desto zahlreicher werden
inkompatible Ad-hoc-Definitionen dieser Sache entwickelt, für deren
spätere Standardisierung aufgrund der relativen Belanglosigkeit kein
Aufwand getrieben wird.
Das Problem besteht also darin, dass in jeder logistischen Anwendungs-
entwicklung implizit grundlegende Modelle und Definitionen der Logistik
festgelegt werden, die spätere Entwicklungen behindern und deren Inkom-
patibilität zu den impliziten Modellen anderer Anwendungen zu Schnittstel-
lenproblemen führt, die nur durch hohen Aufwand behoben werden können.
Die Prinzipien zu einer allgemeingültigen Axiomatik der Logistik lassen
sich erfolgreich nur dann entwickeln, wenn diese Problematik ausreichend
addressiert wird.
Damit kann die erste der anfangs gestellten Fragen beantwortet werden.
Erst eine explizit entwickelte Axiomatik der Logistik ermöglicht eine grund-
sätzliche, übergeordnete Strukturierung der Logistik als regulatives Prinzip
für die Entwicklung von standardisierten Gestaltungsmethoden. Eine ex-
plizit entwickelte Axiomatik erleichtert die Betrachtung der Logistik als
Wissenschaftsdisziplin, die Einzelproblemstellungen und Gesamtprobleme
verbindet und den beteiligten Disziplinen Vorgaben aus dem Gesamtzusam-
menhang der Logistik zuweisen kann.
Die Beantwortung der zweiten Frage ergibt sich aus dem Wunsch, ein
Verfahren der Bewegungsplanung für physische Objekte aus dem Gesamt-
zusammenhang einer Axiomatik der Logistik heraus zu entwickeln. Der
konkrete praktische Einsatz der in dieser Arbeit entwickelten Axiomatik
ist die Ableitung von Prinzipien für gitterbasierte und freie Bewegung aus
logistischen Axiomen heraus. Diese Prinzipien sollen miteinander in Re-
lation gesetzt werden, sodass eine allgemeine anwendungsunabhängige
Forschungslücke im Rahmen logistischer Bewegungsplanung bestimmt wer-
den kann, die nicht mehr von einer anderen Fachdisziplin dominiert wird
(in diesem Fall Robotik).
3.2 Aufbau der Axiomatik
Die Begriffe der Logistik werden aus einer Betrachtung der Strukturierung
des logistischen Raums entwickelt, die sich an der Theorie der Bewegungpla-
nung aus der Robotik orientiert (vgl. Abschnitt 2.4.3). Es werden Axiome der
Logistik aufgestellt, die auf mathematischen Konzepten der Topologie basie-
ren, aus denen sich weitere Prinzipien der Logistik ableiten lassen. Anhand
3.2 Aufbau der Axiomatik 65
von Beispielen und Erläuterungen der Axiome werden die unterschiedli-
chen Prinzipien erläutert und gezeigt, wie sich eine begriffliche Struktur
der Logistik aus den Axiomen und in Zusammenhang mit den abgeleiteten
Prinzipien entfaltet. Das Adjektiv logistisch wird im Rahmen der Axiomatik
bereits vor einer Definition des Begriffs Logistik verwendet, um allgemein ver-
wendete Begriffe, wie etwa den Raum, von den hier aufgestellten Begriffen
zu unterscheiden.
Strukturierung des Raums
Der grundlegende Begriff der Axiomatik ist der logistische Raum mit dem
dazugehörigen Prinzip von der Strukturierung des Raums. Der logistische
Raum ist ein künstliches Gedankenkonstrukt, das die physische Wirklichkeit
vereinfacht abbildet und eine allgemeine Beschreibung und Lösung von
Problemstellungen und Charakteristiken logistischer Systeme ermöglicht.
Er kann mathematisch alsMannigfaltigkeit aufgefasst werden, also als topo-
logischer Raum, der lokal dem als euklidisch angenommenen physikalischen
Raum gleicht (vgl. Abschnitt 2.4.3). Zugleich ist er auch ein soziales Kommu-
nikationsmodell für die Koordination logistischen Handelns und häufig von
einer pragmatischen Ungenauigkeit geprägt (z. B. die Anweisung: „Stell die
Palette mit den grünen Kisten hinten links in die Ecke.“).
Für die irdische Logistik kann die Sphäre der Erdkugel als grundsätzli-
che Referenz-Mannigfaltigkeit angesehen werden. Hier wird jede Region
als Karte im Koordinatenraum R2 auf eine Ebene abgebildet (siehe Abbil-
dung 3.2). Die Menge aller Karten bildet die Oberfläche vollständig ab und
wird Atlas genannt. Zwischen den Karten sind Übergänge definiert, die einen
geordneten Kartenwechsel erlauben.
Das Beispiel der Kartierung der Erde ist sehr anschaulich, aber auch in-
sofern irreführend, als es die klassische geographische Strukturierung des
Raums mit vermessungstechnischer Genauigkeit suggeriert. Am Beispiel ei-
ner Mobilfunkzelle lässt sich eine andere Art von Strukturierung des Raums
veranschaulichen, die sich an einer kabellosen Kommunikationsinfrastruktur
orientiert. Abbildung 3.3a illustriert einen Mobilfunkturm als Kern einer
zellularen Struktur, die idealisiert gleichmäßig den physischen Raum ab-
deckt, aber in der Wirklichkeit sehr irreguläre Formen annehmen kann (siehe
Abbildung 3.3b).
Betrachtet man Systeme der innerbetrieblichen Logistik, so kann man den
logistischen Raum als Mannigfaltigkeit auffassen, indem die räumlichen
Bereiche einzelner Gewerke die Karten eines Atlas bilden, der den Raum
vollständig beschreibt (siehe Abbildung 3.4).
66 3 Axiomatik der Logistik
50°
90° 40°
90°
50° 90°
Abb. 3.2 Die Erdoberfläche ist eine Mannigfaltigkeit, sie kann in einem Atlas über
mehrere Karten dargestellt werden.
(a) (b)
Abb. 3.3 (a) Mobilfunkturm als Kern einer zellularen Struktur (b) Irreguläre Struktur von
Mobilfunkzellen am Beispiel eines Voronoi-Diagramms
Logistischer Raum
Sei L ein logistischer Raum, U ⊂ L eine offene Teilmenge und A ⊂Rn
eine offene Teilmenge des euklidischen Raums. Ein Atlas von Karten
φ :U→ A, bestehend aus der Menge A = {(Ui,φi)|i ∈ I} von Karten
auf L, deren Definitionsbereiche L überdecken, definiert den logisti-
schen Raum als Mannigfaltigkeit. Die Karten des Atlas hängen über
definierte Kartenübergänge zusammen. Die Lage der Karten zueinan-
der sowie der spezifische Charakter der Kartenübergangsfunktionen
bilden die Struktur des logistischen Raums. Der logistische Raum ist
endlich.
3.2 Aufbau der Axiomatik 67
Ein so definierter logistischer Raum bildet eine Struktur, bestehend aus zu-
sammenhängenden, vereinfachten Karten des physischen Raums innerhalb
eines Gebäudes oder Firmengeländes. Der Ansatz über den Begriff der Man-
nigfaltigkeit erlaubt eine grundlegende Definition, die sich einerseits gut mit
der klassischen Aufteilung logistischer Systeme in Subsysteme verträgt und
zugleich eine Basis für Anknüpfungspunkte zur Theorie der Bewegungspla-
nung bietet (vgl. Abschnitt 2.4.3).
Gassen des Hochregals
Ui+1
Vorzone Ui
Abb. 3.4 Der Atlas des Hochregallagers, bestehend aus verbindender Vorzone und
Lagergassen, beschreibt die Mannigfaltigkeit des Systems.
Die Struktur des logistischen Raums ergibt sich durch eine explizite Tren-
nung in disjunkte Umgebungen. Die Möglichkeit, den Trennungsbegriff zu
definieren, ergibt sich aus der euklidischen Metrik, die im logistischen Raum
gilt. Dies bedeutet, dass Abstände zwischen zwei Punkten gemessen werden
können und damit der Begriff der Umgebung definiert werden kann: Sei
(Rn,d) ein euklidischer Raum mit der Metrik d. Eine Menge U ⊆ Rn heißt
genau dann Umgebung von x ∈Rn, wenn es ein ε > 0 gibt, sodass für alle
y ∈Rn mit d(x,y)< ε die Eigenschaft y ∈U erfüllt ist (siehe Abbildung 3.5a).
Darauf aufbauend lässt sich das Trennungsaxiom für die Logistik definieren,
das umgangssprachlich mit dem folgenen Sprichwort beschrieben werden
kann: „Space is what stops everything from being in the same place. [Raum
ist das, was die Dinge daran hindert, alle am selben Platz zu sein.]“ Das hier
definierte Axiom der logistischen Trennung erweitert die Definition des haus-
dorffschen Trennungsaxioms, nach dem ein topologischer Raum dann die
Hausdorffeigenschaft hat, wenn für alle x,y ∈ M mit x 6= y disjunkte offene
Umgebungen Ux und Uy existieren (siehe Abbildung 3.5b).
Axiom der Trennung
Seien x,y ∈ L Punkte im logistischen Raum und Ux,Uy ihre Umge-
bungen, dann bilden die Formen Fx ⊂Ux,Fy ⊂Uy jeweils spezifische
Untermengen ab. Sind die Formen disjunkt, dann heißen sie getrennt.
Dieses Trennungsaxiom bildet zum einen die Grundlage für eine Definition
logistischer Orte, Plätze und Objekte, und zum anderen kann auf seiner Basis
eine lokale Nachbarschaft für physische Objekte definiert werden, die für eine
68 3 Axiomatik der Logistik
Ux Uy
L Fx Fy
x x y
(a) (b)
Abb. 3.5 (a) Die Menge L ist eine Umgebung des Punkts x. (b) Beispiel für das
Trennungsaxiom: zwei Punkte x und ymit ihren Formen Fx und Fy, die durch
Umgebungen getrennt werden
Definition verteilter Intelligenz und dezentraler Steuerung ausschlaggebend
ist (siehe Dezentralität in cyberphysischen Systemen Abschnitt 2.2).
Zunächst werden logistische Orte definiert. Der Unterschied zwischen
Orten und Plätzenwurde hier vor demHintergrund der existierenden Begriffe
Lagerort und Lagerplatz gewählt: Ein Ort ist ein eindeutig identifizierbarer Teil
des logistischen Raums, während auf einem Platz physische Objekte getrennt
voneinander platziertwerden können.
Logistischer Ort
Sei O ⊂ L die Menge aller logistischen Orte, so ist jeder dieser Orte
o ∈O eindeutig identifizierbar über die Funktion id :O→ IO. Dabei
existiert für jeden Ort eine festgelegte, geschlossene Umgebung. Orte
können andere Orte beinhalten. Die Umgebungen von Orten können
sich wechselseitig überlappen.
Ein logistischer Platz hingegen definert sich über seine Beziehung zu den
Objekten. Er ist ein Ort, auf dem sich Objekte aufhalten können. Plätze
können klassifiziert werden, wenn es einen Bezug zu bestimmten Klassen
von Objekten gibt (z. B. Behälterstellplatz, Palettenplatz).
Logistischer Platz
Sei P die Menge aller logistischen Plätze, so ist jeder dieser Plätze
p ∈ P eindeutig identifizierbar über die Funktion id : P→ IP. Dabei
gibt es für jeden Platz eine festgelegte, geschlossene Umgebung, die
sich nicht mit den Umgebungen anderer Plätze überschneidet.
Die Menge von Plätzen bildet mit ihrer geometrischen Anordnung im lo-
gistischen Raum die abstrakte Verwaltungsstruktur eines Logistiksystems.
Eine häufig vorkommende Anordnung ist das regelmäßige Raster bzw. Git-
3.2 Aufbau der Axiomatik 69
o2
o1
o3
o5
o4
Abb. 3.6 Beispiel eines logistischen Raums mit logistischen Orten. Die schraffierte Fläche
kennzeichnet freien Raum, der keinem Ort zugeordnet ist.
Abb. 3.7 Schema eines Blockzeilenlagers
ternetz, wie es beispielsweise in Regallagern oder Bodenblocklagern (vgl.
Abbildung 3.7) zum Einsatz kommt.
Logistische Objekte
Während sich die Strukturierung des logistischen Raums auf topologischen
Konzepten der Mathematik gründet, stammen die Axiome und Prinzipien
zum Inhalt des Raums aus der logistischen Praxis. Die im folgenden aufge-
stellten Begriffe unterscheiden sich vor allem durch ihren Abstraktionsgrad
in Bezug auf die Trennbarkeit und die Identifizierbarkeit einzelner Objekte.
Der Begriff mit dem höchsten Abstraktionsgrad ist der des logistischen Ma-
terials. Er beschreibt alle unterscheidbaren Klassen von physischem Material,
die eine logistische Relevanz innerhalb eines betrachteten Systems besitzen.
Das Material unterscheidet sich von der ortsfesten Infrastruktur durch sei-
ne Beweglichkeit. Es wird nicht getrennt betrachtet und einzelne Objekte
werden nicht gezählt (vgl. Schüttgut). Die Bestimmung der Quantität erfolgt
über eine Messung in einer zur Klasse passenden Maßeinheit (z. B. Gewicht
in kg). Der Bezug zur Strukturierung wird über eine Verortung hergestellt.
70 3 Axiomatik der Logistik
Jede Menge von Material mit einer Quantität ist eindeutig einem logistischen
Ort zugeordnet.
Logistisches Material
Sei M die Menge aller Klassen von physischemMaterial, die eine logis-
tisch relevante Bedeutung im Raum L haben. Dann gibt die Funktion
content :O→ MO ∈ M die Klassen von physischen Objekten zurück,
die sich an einem Ort befinden, und die Funktion quantity : MO→R
liefert die jeweilige am Ort befindliche Quantität in einer zur Klasse
passenden Maßeinheit.
Eine Spezialisierung logistischen Materials sind die logistischen Artikel. Sie
repräsentieren einzeln trennbare und damit zählbare physische Objekte (vgl.
Stückgut). Alle Objekte einer Artikelklasse weisen die gleichen Eigenschaften
auf, sie sind untereinander austauschbar. Objekte innerhalb einer Artikelklas-
se unterscheiden sich nicht und sind daher nicht eindeutig identifizierbar.
Typischerweise wird eine Artikelklasse über eine Artikelnummer beschrieben,
die auch außerhalb des Logistiksystems eine eindeutige Kennzeichnung ist.
Artikel bilden die Geschäftsobjekte eines Logistiksystems, und ihre Verwal-
tung ist Kernbestandteil seiner Funktionalität.
Logistischer Artikel
Sei M die Menge aller Klassen von physischen Objekten, die eine
logistisch relevante Bedeutung im Raum L haben. Dann sei A ∈ M
die Menge an physischen Objekten, die einzeln trennbar und damit
zählbar sind und deren Verwaltung und Bewegung zur Hauptaufgabe
des Logistiksystems gehören. Artikel sind nicht einzeln identifizierbar,
sondern nur klassifizierbar.
Während sich die Begriffe des Materials und des Artikels auf Klassen bezie-
hen, steht der Begriff des logistischen Objekts für ein eindeutig identifizierbares
physisches Objekt im logistischen Raum. Ein logistisches Objekt projiziert
das reale Objekt auf eine abstrakte Form, die durch eine eindeutige Position
und Rotation seine Belegung im logistischen Raum beschreibt. Aus dem
Axiom der Trennung folgt, dass sich keine zwei logistischen Objekte mit
ihren Formen überdecken können.
3.2 Aufbau der Axiomatik 71
Logistisches Objekt
Sei D ⊂ L die Menge aller logistischen Objekte, so ist jedes dieser
Objekte d ∈ D eindeutig identifizierbar über die Funktion id : D→ ID.
Für jedes Objekt kann über die Funktion env : D→ L eine Umgebung
Ud ∈ L bestimmt werden, die das Objekt im Raum belegt. Über die
Funktion f orm : D→ L kann die spezifische Form Fd ∈Ud innerhalb
der Umgebung bestimmt werden. Der Definitionsbereich der Funktion
besteht aus der Menge aller Punkte in L, sodass die Bildmenge der
Form zu jeder Zeit vollständig im logistischen Raum liegt.
Das logistische Objekt bildet mit seiner Projektion eine Verkürzung der Wirk-
lichkeit ab, die in der Regel mit einer Reduzierung der räumlichen Dimen-
sionen einhergeht. Das Axiom des Beinhaltens beschreibt den Erhalt der Infor-
mationen über das reale Objekt bei einer solchen räumlichen Verkürzung.
Es steht im Gegensatz zum Axiom der Trennung für die Möglichkeit, dass
sich mehrere Objekte und Artikel gleichzeitig am selben Ort im logistischen
Raum aufhalten können. In dieser Axiomatik bezieht sich der Begriff des
Beinhaltens ausschließlich auf Artikel (vgl. Abbildung 3.8a). Damit werden
insbesondere Ladehilfsmittel, wie etwa Pakete oder Behälter, abgebildet.
Axiom des Beinhaltens
Sei d ∈ D ein logistisches Objekt und beschreibe Ad ∈ A die Menge an
unterschiedlichen Artikelklassen, die Inhalt des logistischen Objekts d
sein können. Dann gibt die Funktion content : D→ Cd ∈ Ad die Menge
von tatsächlich enthaltenen Artikelklassen zurück, und die Funktion
count : Ad→N liefert die Anzahl an enthaltenen Artikeln. Die Artikel
vollziehen als Inhalt jeden Ortswechsel des Objekts nach.
Wenn ein logistisches Objekt ein anderes logistisches Objekt enthält, wird
dies über das Axiom der Vereinigung abgebildet (vgl. Abbildung 3.8b). Es
beschreibt eine hierarchische Beziehung zwischen über- und untergeordneten
Objekten. Die Position und Rotation eines untergeordneten Objekts wird
nach der Vereinigung relativ zu der des übergeordneten Systems betrachtet.
Auf diese Weise werden räumliche Strukturen innerhalb logistischer Objekte
abgebildet.
72 3 Axiomatik der Logistik
d1 d1
(a3 , 15)
d2
(a8 , 10) d3
(a7 , 2)
d4
(a) (b)
Abb. 3.8 (a) Das logistische Objekt d1 beinhaltet die Artikel a3, a7 und a8. (b) Die
logistischen Objekte d2, d3 und d4 sind innerhalb von d1 vereinigt.
Axiom der Vereinigung
Seien d, e ∈ D logistische Objekte und sei die Form f orm(d) derart,
dass sie in die Form f orm(e) passt, dann können d und e derart ver-
einigt werden, dass d zum Inhalt von e gehört und im Sinne einer
Baumstruktur untergeordnet ist. Die Funktion children : D→ DC ∈ D
gibt die Menge der untergeordneten Objekte zurück. Die Funktion
parent : D→ D liefert das übergeordnete Objekt zurück. Alle unterge-
ordneten Objekte bewegen sich zusammen mit dem übergeordneten
Objekt.
Der Unterschied zwischen den Begriffen des Beinhaltens und des Vereinigens
ist ein Kerngedanke der Axiomatik, der die verschiedenen Grade der Verkür-
zung physischer Wirklichkeit abbildet, die inhärent mit der Fähigkeit eines
Systems zur Beobachtung der Wirklichkeit verbunden sind. Das Vereinigen
erhält die Information über die Identität des untergeordneten Objekts, das
weiterhin vom übergeordneten Objekt getrennt betrachtet werden kann, wäh-
rend das Beinhalten keine Informationen über Identität, Form oder Position
von Einzelobjekten kennt.
Durch das Vereinigen lässt sich der Raum auf logistischen Objekten struk-
turieren, wie es z. B. bei dem Packmuster einer Palette auftritt (siehe Abbil-
dung 3.9). Hier ist es eher eine Frage des Betrachtungsrahmens, ob diese
feingliedrige Strukturierung als lohnenswerter Teil des logistischen Raums
gesehen werden sollte. Die weitergehende Fragestellung ist hier jedoch, wel-
chen Einfluss die erreichbare Genauigkeit und Häufigkeit von Messungen
auf dieModellierung haben sollte undwo grundsätzlich die Grenze zwischen
der Struktur des Raums und seinen Inhalten gezogen wird.
3.2 Aufbau der Axiomatik 73
Abb. 3.9 Vereinigung von logistischen Objekten: Strukturierung des Raums auf einem
logistischen Objekt am Beispiel einer Palette
Der Zusammenhang zwischen Ladehilfsmitteln, Plätzen und Orten bei der
Modellierung lässt sich gut am Beispiel eines Palettendurchlaufregals ver-
anschaulichen. Hierbei handelt es sich im Prinzip um die rein mechanische
Realisierung des Modells einer FIFO-Warteschlage. Die Paletten werden
auf das eine Ende einer schrägen Rollenbahn aufgesetzt und rollen von der
Schwerkraft angetrieben zum anderen Ende hin (siehe Abbildung 3.10). Die
gesamte Rollenbahn kann als ein einzelner Platz angesehen werden, auf dem
mehrere Paletten gelagert werden. Sowohl die Regalgasse als übergeordne-
ter Ort als auch die Übergabestellen als untergeordnete Orte ergänzen das
Modell. Die Trennung wird durch die Verwendung von Standardpaletten im
Zusammenspiel mit Bremsrollen und einer Durchschubsicherung erreicht.
So kann ein von der individuellen Form der zu lagernden Artikel unabhän-
giges Modell abstrakt beschrieben werden. Das Bemerkenswerte an dem
Beispiel des Palettendurchlaufregals ist, dass es vollkommen ohne Automa-
tisierungstechnik bereits die Realisierung eines nicht-trivialen, logistischen
Verhaltenmodells darstellt.
Abb. 3.10 Palettendurchlaufregal
Das Beispiel der Standardpalette illustriert die Bedeutung von standardisier-
ten Ladehilfsmitteln für die Strukturierung des Raums. Durch ihren Einsatz
werden Größe und Form logistischer Artikel und Objekte aus Sicht des Sys-
tems vereinheitlicht. Dies ermöglicht wiederum, die Form und Größe der
Plätze zu standardisieren.
74 3 Axiomatik der Logistik
Zustandsänderungen
Neben der Änderung der Struktur des logistischen Raums sowie der Or-
te und Plätze bilden die vier Aktivitäten des Vereinigens/Auflösens und
des Hinzufügens/Entnehmens die grundlegenden Formen der inneren Zu-
standsänderung von Objekten in dieser Axiomatik. Als weiteres Merkmal
dieser Aktivitäten ist festzuhalten, dass sie nur in ihrer lokalen Nachbarschaft
auftreten können. Damit soll ausgedrückt werden, dass alle Tätigkeiten, die
verkürzt abgebildet dazu führen, dass sich die Zuordnung eines physischen
Objekts zu einem logistischen Objekt ändert, nur durch kleinere lokale Be-
wegungen und mechanische Veränderungen unmittelbar am logistischen
Objekt erfolgen (z. B. Hineinlegen, Aufstellen, Verpacken, Befestigen usw.).
Zu diesem Zweck wird eine Nachbarschaft definiert, die das Konzept dieser
lokalen, räumlichen Nähe zwischen Objekten beschreibt.
Nachbarschaft
Für jedes Objekt d können über die Funktion neighbours : D→ Dn ∈ D
die Objekte abgefragt werden, die sich in der Nähe von d befinden.
Die genaue Bestimmung der Nachbarschaft hängt von den jeweiligen
konkreten Objekten und ihren Ausmaßen ab, die abgebildet werden.
Die Nachbarschaft eines Objekts bewegt sich immer mit dem Objekt
selbst mit, sodass dieses sich im Mittelpunkt der Umgebung befindet.
Eine Änderung der Anzahl und Zusammensetzung der Nachbarn
ergibt sich durch eine Ortsveränderung entweder des Objekts oder
seiner Nachbarn.
Das Axiom der lokalen Zustandsänderung soll hier aufgestellt werden, um
auszudrücken, dass zwei Objekte sich in räumlicher Nähe befinden müssen,
damit sie ihre jeweiligen Zustände untereinander wechseln können. Dabei
erhalten intrinsische Zustandsänderungen die Gesamtmenge an logistischen
Materialien, die sich im System befinden: Es kommt weder neues Material
hinzu, noch geht Material verloren. Als extrinsische Zustandsänderungen gel-
ten alle Änderungen, die sich auf die Gesamtmenge und -zusammensetzung
von Material im System auswirken.
3.2 Aufbau der Axiomatik 75
d1 d2
(a , 15) (a , 0)
Abb. 3.11 Zwei logistische Objekte in ihrer jeweiligen Nachbarschaft (schraffierte Linie)
Axiom der lokalen Zustandsänderung
Alle Zustandsänderungen eines logistischen Objekts erfolgen in einer
lokal begrenzten Umgebung. Seien d, e∈D logistische Objekte, so kann
ein Zustandstransfer zwischen diesen Objekten nur stattfinden, wenn
gilt: d ∈ neighbours(e) und e ∈ neighbours(d). Auch die Bewegung
als systemweite Ortsveränderung eines Objekts erfolgt durch eine
Verkettung von lokalen Ortsveränderungen. Aus globaler Systemsicht
werden diese lokalen Zustandsänderungen mikroskopisch genannt.
Die spezifische Zuordnung eines physischen Objekts zu den logistischen
Objekten oder zu den Artikeln ist beim Einsatz dieser Axiomatik in einer
praktischen Anwendung eine kritische Modellierungsentscheidung.
Wege und Relationen
Neben dem einfachen Vorhandensein von Orten, Plätzen und Objekten ist
ein Logistiksystem von der Möglichkeit bzw. Notwendigkeit gekennzeichnet,
die Objekte zu bewegen. Die Definition eines logistischenWegs orientiert sich
an der Definition des Wegs aus der Geometrie und ergänzt diese durch die
Berücksichtigung der Umgebung eines Objekts, dessen wirkliche, physische
Belegung im logistischen Raum sie darstellt.
76 3 Axiomatik der Logistik
Logistischer Weg
Sei L ein logistischer Raum und I = [a,b] ein reelles Intervall. Ein
logistischer Weg kann über die stetige Funktion f : I → L definiert
werden, wenn ein Objekt ∃d ∈ D existiert, so dass für seine Hülle auf
der Bahnkurve env( f (I)) ∈ L gilt, also für alle Punkte der Bahnkurve
auch die Umgebung von d immer im logistischen Raum liegt. Die
Punkte f (a) und f (b) heißen Anfangs- und Endpunkt der Kurve.
In Abbildung 3.12a ist eine solche Bahnkurve von Ort a nach Ort b gestrichelt
gezeichnet, während die Hülle die Punkte der Kurve im logistischen Raum
(gestrichelter Bereich) umfasst, die vom bewegten Objekt belegt werden.
Ein Weg ist eine von vielen möglichen Verbindungen zwischen zwei Orten.
In einem logistischen System stehen grundsätzlich alle Orte zueinander in
Relation, daher gibt es immer mindestens einen logistischen Weg zwischen
zwei Orten, sodass der logistische Raum eine einzige Wegzusammenhangs-
komponente darstellt.
Abbildung 3.12b zeigt die Homotopie zweier Kurven und soll als Veran-
schaulichung für die Vielzahl an möglichen Wegen zwischen zwei Orten im
freien logistischen Raum dienen. Im späteren Verlauf der Arbeit wird eine
solche Homotopiegruppe von Kurven eine tragende Rolle für eine heuris-
tische Verbesserung der in dieser Arbeit entwickelten Bewegungsplanung
spielen (siehe Kapitel 6).
y0(t) y
a x H(t,s)
b
y1(t)
(a) (b)
Abb. 3.12 (a) Bahnkurve eines logistischen Wegs von a nach b mit ihrer Hülle (b)
Homotopie zweier Kurven
Betrachtet man zwei logistischeWege von a nach b und von x nach ymit ihren
Hüllen, dann sind sie disjunkt, wenn envab( fab(Iab)) ∩ envxy( fxy(Ixy)) = ∅
gilt. Zwei Objekte, die sich auf diesen Kurven bewegen, werden sich nie-
mals direkt beeinflussen, insbesondere entstehen keine Kollisionen (siehe
Abbildung 3.13a). Kreuzen sich die Wege oder gibt es eine anderweitige
Überlappung der Hüllen, dann ensteht eine Konfliktzone K, die von der
Schnittmenge der Hüllen K = envab( fab(Iab)) ∩ envxy( fxy(Ixy)) gebildet
wird (siehe Abbildung 3.13b). In dieser Zone sind Kollisionen von Objekten
möglich, sodass ein logistisches System durch ein geeignetes Steuerungs-
3.2 Aufbau der Axiomatik 77
verfahren die Bewegung der beiden Objekte in Abhängigkeit voneinander
kollisionsfrei koordinieren muss.
y y
x
b b
a
a
x
(a) (b)
Abb. 3.13 (a) Zwei disjunkte logistische Wege (b) Zwei logistische Wege mit Konfliktzone
Im Rahmen derModellbildung und späteren Realisierung ist der Unterschied
zwischen demWeg als logistischem Konzept der Erreichbarkeit von Orten
und der zugehörigen Bahnkurve als Bildmenge von Punkten im logistischen
Raum wichtig: Die Existenz eines Wegs von a nach b bedeutet, dass es im
logistischen Raum eine Bahnkurve gibt, sodass in der physischen Wirklich-
keit ein Objekt von a nach b bewegt werden kann. Wenn die Bildmenge
punktgenau bestimmt werden soll, dann kann das entweder über eine Be-
obachtung der Wirklichkeit geschehen oder über eine Parameterdarstellung
der Kurve berechnet werden. Die Grundaufgabe eines Steuerungsverfahrens
ist die Lösung der Aufgabe der Planung einer Bewegung und ihre geregelte,
kontrollierte Ausführung in der Wirklichkeit.
Wenn der logistische Raum so beschaffen ist, dass zwischen zwei Orten
oder Plätzen dauerhaft logistische Wege existieren, über die eine oder meh-
rere Klassen von Objekten bewegt werden können, dann stehen diese Orte
oder Plätze in Relation zueinander. Hinter dem Konzept der logistischen
Relation steht zum einen der Wunsch nach der weitergehenden Abstraktion
des Raums hin zu einer Netzwerkdarstellung als Graph mit Knoten und
Kanten. Zum anderen ist die Relation auch ein Ausdruck des Bewegungs-
potenzials im logistischen Raum, weg von der Betrachtung der Bewegung
eines einzelnen Objekts, hin zur Bewegungsmöglichkeit und -koordination
vieler Objekte.
Logistische Relation
Zwei logistische Orte oder Plätze stehen in Relation zueinander, solan-
ge es mindestens einen logistischen Weg gibt, der beide verbindet. Die
logistische Relation kann gerichtet oder ungerichtet sein und bildet
die Grundlage für Definitionen logistischer Netzwerke.
78 3 Axiomatik der Logistik
Die logistische Relation ist ein mächtiges Werkzeug zur Verkürzung der
Wirklichkeit auf essenzielle logistische Zusammenhänge. In der Netzwerk-
darstellung als Graph mit Knoten und Kanten liegt aber auch die Gefahr
verborgen, dass der logistische Raum zu sehr vereinfacht wird. Zum einen
kann eine Kante als einzelner Weg missverstanden werden, zum anderen
werden Graphen oft als Planungswerkzeug benutzt und stellen eine statische
Struktur des logistischen Raums dar, die eine freie Nutzung des tatsächlich
vorhandenen physischen Raums zugunsten vordefinierter Wege aufgibt.
Dynamik und Bewegung
Mit den vorangegangenen Definitionen und Überlegungen kann nun ei-
ne grundlegende Definition der Logistik erfolgen, indem diese um die Zeit
ergänzt werden.
Logistik
Die Logistik beschreibt die vernünftige Bewegung logistischer Ob-
jekte an Orten, durch die Zeit und in Relationen.
Zum Beispiel wird die Bewegung eines Objekts von einemOrt a zu einemOrt
b innerhalb eines Intervalls T der Zeit auf der Bahnkurve eines logistischen
Wegs beschrieben. Die Vernunft der Bewegung könnte zum Beispiel bedeuten,
dass der Weg mit der kürzesten Bahnkurve gewählt wird. Es kann aber auch
sein, dass eine längere Kurve gewählt wird, deren Weg weniger Konfliktzo-
nen enthält und die somit in kürzerer Zeit zum Ziel kommt. Somit fällt unter
den Begriff der Vernunft auch der Bereich der Prinzipien der klassischen
Optimierung (z. B. des Operations Research).
Für die Beschreibung der Bewegung reicht für die Logistik ein kinodyna-
mischer Ansatz aus, der rein geometrisch zusätzlich zu den Größen Ort und
Zeit die Ableitungen Geschwindigkeit, Beschleunigung und Ruck berücksichtigt.
Das räumliche Bezugssystem bildet der logistische Raum, während das zeit-
liche Bezugssystem von der Lage und Ausdehnung des logistischen Raums
in der physischen Wirklichkeit abhängt.
Prinzip der Kollisionsfreiheit
Die Bewegung aller logistischen Objekte erfolgt kollisionsfrei. Die Um-
gebungen zweier Objekte, die nicht vereinigt sind und sich nicht be-
inhalten, werden sich zu keinem Zeitpunkt überdecken.
Aus dem Trennungsaxiom unter Hinzunahme der Zeit folgt, dass sich zwei
Objekte nicht zur gleichen Zeit am gleichen Ort befinden können. Die Ge-
schwindigkeiten zweier Objekte auf sich kreuzenden Bahnkurven ist stets so
angepasst, dass keine Kollision entsteht.
3.2 Aufbau der Axiomatik 79
Logistische Prozesse
Ein weiteres Kennzeichen eines logistischen Systems sind wiederkehrende
Bewegungsvorgänge entlang definierter Relationen. Dies folgt aus der end-
lichen Anzahl von Orten und Plätzen, die durch eine endliche Anzahl von
Relationen verbunden sind. Über die Zeit werden die Bewegungen unter-
schiedlicher Objekte für eine Relation entlang logistischerWege durchgeführt,
die sich gleichen oder sehr ähnlich sind.
Axiom der wiederkehrenden Bewegungsvorgänge
Logistik ist gekennzeichnet von wiederkehrenden Bewegungsvorgän-
gen im logistischen Raum. Die Planung von wiederkehrenden Be-
wegungsvorgängen ermöglicht bzw. erfordert die Betrachtung des
Bewegungspotenzials eines Systems und die Untersuchung der Mög-
lichkeit paralleler Bewegungsvorgänge über alle möglichen Wege aller
Relationen unter Berücksichtigung der Kollisionsfreiheit.
Über wiederkehrende Bewegungsvorgänge ließe sich eine Art von Fluss-
begriff für den logistischen Raum definieren. Jedoch stehen hier die schon
existierenden Begriffe etwas imWege. Auf der einen Seite ist derMaterialfluss
als Begriff zu breit und abstrakt gefasst, da er im Grunde als Verkettung sämt-
licher Zustandsänderungen eines physischen Objekts definiert ist. Auf der
anderen Seite ist der physikalische Flussbegriff eher als Durchsatzdefinition
von Teilchen durch eine beobachtete Fläche zu sehen.
Mit der Grundidee eines Flusses ergibt sich jedoch die Vorstellung von spe-
zifischen Orten, an denen dieser Fluss entsteht und wo er versiegt. Was für
die Bewegung einzelner Objekte der Startort und der Zielort sind, bilden für
wiederholte Bewegungsvorgänge die Quellen und die Senken ab. Die grundle-
gende Ursache für die Festlegung besonderer Orte ist, dass in vielen realen
Systemen spezifische Zustandsänderungen nicht überall stattfinden können.
Welche Zustandsänderungen wo stattfinden können, ist anwendungsspezi-
fisch. Zu den besonderen Orten zählen z. B. der Wareneingang und -ausgang
in Lagerhäusern oder auch Kommissionierplätze. Im Allgemeinen wird in
dieser Axiomatik von der Existenz besonderer Orte und Plätze ausgegan-
gen, die als Quellen und Senken von wiederholten Bewegungsvorgängen
angenommen werden.
80 3 Axiomatik der Logistik
Axiom der besonderen Orte und Plätze
Der logistische Raum enthält besondere Orte und Plätze, die jeweils
einer Klasse zugeordnet sind. Für jede Klasse sind Zustandsänderun-
gen definiert, die an diesen Orten durchgeführt werden können. Die
besonderen Orte bilden Startorte und Zielorte von Relationen. Beson-
dere Plätze sind Start und Ziel individueller Bewegungsvorgänge von
logistischen Objekten.
Zu dem Begriff der Vernunft der Bewegung im logistischen Raum gehört
einerseits die Vermeidung unnötiger Bewegungen, andererseits auch die
gezielte Bewegung zu besonderen Orten und Plätzen mit dem Zweck der Zu-
standsänderung. Die extrinsischeMotivation für diese gezielten Bewegungen
findet sich in anwendungsspezifischen Prozessen, für deren Bearbeitung be-
stimmte Zustandsänderungen erforderlich sind. Für diese Axiomatik ist eine
formale Definition des Prozessbegriffs nicht notwendigerweise zielführend,
da sie in Konkurrenz zu anderen Definitionen stehen würde und für den
eigentlichen Fokus der Betrachtung der Bewegungsplanung nicht benötigt
wird.
Gezielte Bewegungen zu besonderen Orten führen zusammen mit der
Kollisionsfreiheit zu einer natürlichen Reihenfolgebildung der Objekte im
logistischen Raum. Diese natürliche Reihenfolge führt zu einer Sequenzie-
rung der Bewegungsvorgänge, die sich direkt auf die Struktur der Objekte im
Raum auswirkt. Wenn eine spezifische Strukturierung der Objekte erwünscht
ist, dann erfordert dies eine gezielte Reihenfolgebildung.
Reihenfolgebildung
Kollisionsfreihe Bewegungsvorgänge durch besondere Orte führen zu
einer natürlichen Reihenfolgebildung der Objekte im logistischen Raum.
Zusätzlich kann eine gezielte Reihenfolgebildung für die Organisation
der Objekte im Raum definiert werden, die zusätzlich zu den sonstigen
Bedingungen für die Bewegungsplanung berücksichtigt werden muss.
Durch die Reihenfolgebildung werden logistische Objekte und ihre Bewe-
gungsvorgänge voneinander abhängig. Es entsteht eine Vorher-Nachher-
Beziehung, die als partielle Ordnung dargestellt werden kann. Diese raum-
zeitliche Abhängigkeit in der Reihenfolge kann dazu führen, dass ein Be-
wegungsvorgang verändert oder sogar pausiert wird, zum einen, damit
Kollisionen vermieden werden, und zum anderen, damit eine mögliche vor-
gegebene Reihenfolge eingehalten wird.
In beiden Fällen können Warteschlangen entstehen, die entweder klas-
sisch als tatsächliche räumliche Schlangenstruktur gebildet werden (siehe
3.2 Aufbau der Axiomatik 81
Abbildung 3.14a) oder als verteilte Warteschlange im Raum gebildet werden
(siehe Abbildung 3.14b).
Warteschlange
Eine Warteschlange bildet sich aus einer Menge von logistischen Ob-
jekten, die durch eine Vorher-Nachher-Beziehung so lange in Abhän-
gigkeit stehen, bis sie sich durch einen bestimmten Ort bewegt haben.
Sowohl die Objekte als auch der Ort können während des Wartens
stillstehen oder in Bewegung sein.
Warteschlangen können auch durch Engstellen im logistischen Raum auf
natürliche Weise entstehen, wobei die Objekte einzig durch die gemeinsame
Passage der Engstelle in Abhängigkeit geraten.
1
2
3 2 1 0 0
3
(a) (b)
Abb. 3.14 (a) Klassische Warteschlange (b) Verteilte Warteschlange
Im Gegensatz zur klassischen Warteschlangentheorie wird in diesem Axio-
mensystem die Warteschlange nicht als abstrakte Struktur ohne räumliche
Ausdehnung betrachtet, sondern als eine raumzeitliche Abhängigkeit von
logistischen Objekten, die Platz im logistischen Raum belegen (vgl. [Bau13]).
Idealisiertes Förder- und Lagerwesen
Aus dem Prinzip der Kollisionsfreiheit verbunden mit der Endlichkeit des
logistischen Raums folgt die begrenzte Kapazität eines logistischen Systems.
Diese Kapazität ist im Ruhezustand aller Objekte gleich der maximalen
Anzahl an Plätzen, die ohne Überlappung im logistischen Raum angeordnet
werden können. Abbildung 3.15a zeigt das idealisierte Lagerwesen in Form
einer gitterbasierten Anordnung von rechteckigen Dingen mit sehr guter
Raumausnutzung, sodass eine Bewegung der Objekte nur im festgelegten
Raster stattfinden kann (Pfeil in der Abbildung).
Abbildung 3.15b zeigt das idealisierte Förderwesen in Form der gleichzeitigen
kollisionsfreien Bewegung aller Objekte im freien Raum. Während die Ka-
pazität eines logistischen Systems mit vollständig ruhenden Dingen trivial
zu bestimmen ist, führt die Bewegung von Objekten zur Notwendigkeit
von freiem Raum zum Manövrieren, der die allgemein verfügbare Kapazität
82 3 Axiomatik der Logistik
(a) (b)
Abb. 3.15 (a) Kollisionsfreiheit bei gitterbasierter Trennung im Ruhezustand (idealisiertes
Lagerwesen) (b) Gleichzeitige kollisionsfreie Bewegung aller Objekte (idealisiertes
Förderwesen)
verringert. Die genaue Bestimmung des zur Bewegung notwendigen freien
Raums ist von einer Vielzahl von Faktoren abhängig: von kinodynamischen
Zwangsbedingungen bei der Ausführung der Bewegung, der Gestaltung des
logistischen Raums, der Bewegungsplanung.
In der Regel werden logistische Systeme so gebaut, dass es dezidierte
Lagerbereiche gibt, die durch Förderbereiche oder -strecken miteinander
verbunden sind. Ein Beispiel für die Kombination aus Lager- und Förder-
bereichen ist in Abbildung 3.7 mit dem Blockzeilenlager gegeben, mit den
Blöcken als Lagerbereiche und dazwischenliegenden Förderwegen als Zei-
lentrennung. Im Sinne dieser Axiomatik bilden diese Bereiche als Karten
dann in ihrer Gesamtheit den Atlas des logistischen Raums.
3.3 Zur Beobachtung in logistischen Systemen
Mit der bislang beschriebenen Axiomatik wird der Zustand des Logistik-
systems im Sinne eines allwissenden, globalen und zeitunabhängigen Beob-
achters beschrieben. Die Abstraktionen der Axiomatik bringen durch ihre
verkürzte Abbildung der Wirklichkeit die eingeschränkte Fähigkeit zur Er-
kennung und Identifikation von Objekten zum Ausdruck. Zusätzlich ist in
der Regel keine zeitlich und räumlich durchgängige Abdeckung für die Be-
obachtung des physischen Raums gegeben. Es werden in unregelmäßigen
Zeitabständen lokal Ereignisse erzeugt, die einen lokal beschränkten Zustand
zu einem bestimmten Zeitpunkt wiedergeben. Ein Großteil der physischen
Wirklichkeit des logistischen Systems liegt für einen globalen Beobachter zu
jeder Zeit im Verborgenen.
Eine Änderung der Zustände im logistischen System kann nur durch diese
prinzipiell lokal beschränkten Beobachtungsereignisse erfasst werden, deren
zeitverzögerte Aggregation ein globales Abbild des Systems ergeben. Die
3.3 Zur Beobachtung in logistischen Systemen 83
resultierende eingefrorene Systemsicht – der Schnappschuss – repräsentiert
damit immer einen in der Vergangenheit liegenden, statischen Systemzu-
stand.
Die Beobachtungen sind daher natürlicherweise nach den Orten struk-
turiert, an denen sie entstehen und wo sie aufgenommen werden. Diese
Struktur kann insofern als hierarchisch angenommen werden, als die Ag-
gregation von Daten für einen Ort die Information aller Orte beinhaltet, die
innerhalb seiner Umgebung liegen.
Logistische Ordnung
Logistische Ordnung beschreibt den Grad der Fähigkeit eines Sys-
tems, zu einem bestimmten Zeitpunkt die Information bereitstellen
zu können, die auf die einzelnen Zustände der im logistischen Raum
verteilten Objekte schließen lässt.
So gilt ein Lager, das nach dem Prinzip der chaotischen Lagerung arbei-
tet, so lange als logistisch geordnet, wie eine Datenbank mit der aktuellen
Information über die Zuordnung aller Artikel zu ihren Lagerplätzen existiert.
Logistische Entropie
In gewisser Hinsicht lässt sich die Situation in logistischen Systemen mit
Systemen der statistischen Physik vergleichen. In beiden Fällen gibt es eine
makroskopische und eine mikroskopische Sichtweise auf die Objekte (oder
Teilchen) des Systems und eine Grundproblematik bei der Fähigkeit zur
Beobachtung. Aufgrund der lücken- und fehlerhaften Beobachtungsfähig-
keit kann auch im logistischen System von einer spontanen Änderung der
Mikrozustände ausgegangen werden, sodass sich jedes geordnete logistische
System zu einem Zustand der Unordnung hin entwickelt.
Axiom der spontanen Zustandsänderung
Der makroskopische Zustand eines logistischen Systems setzt sich
durch die mikroskopischen Zustände des logistisch relevanten Materi-
als im logistischen Raum zusammen. Die mikroskopischen Zustände
können sich aus Sicht eines globalen Beobachters jederzeit spontan
ändern.
Spontane Zustandsänderungen enstehen zum einen durch Messungenau-
igkeiten und -fehler bei der Erkennung, Klassifikation oder Identifikation
von physischen Objekten. Zum anderen entstehen sie durch ungeplante
und unbeobachtete Bewegungen von physischen Objekten (Herunterfallen,
Steuerungsfehler, Kommunikationsfehler, menschlicher Irrtum, mechanische
Ausfälle, Diebstahl, Unfälle usw.).
84 3 Axiomatik der Logistik
Um den makroskopischen Zustand zu aktualisieren, wird eine gewisse
Menge an zusätzlicher Information benötigt, damit von diesem wieder auf
die tatsächlich vorliegenden Mikrozustände geschlossen werden kann.
Spezielle logistische Entropie
Die eingeschränkte logistische Entropie ist das Maß für die Unkennt-
nis von Position, Geschwindigkeitsvektor und Inhalt aller einzelnen
Objekte im logistischen Raum.
Bezogen auf das hier entwickelte Axiomensystem bezieht sich die einge-
schränkte logistische Entropie in ihrer Zustandsdefinitinon nur auf die im-
manenten Eigenschaften aller logistischen Objekte: Position oder Standort
sowie Inhalt. Es ist möglich, die Entropiedefinition um weitere Eigenschaften
zu erweitern, wenn dies für ein konkretes logistisches System notwendig
erscheint.
Allgemeine logistische Entropie
Die logistische Entropie ist das Maß für die Unkenntnis der Zustände
aller einzelnen Objekte im logistischen Raum.
Die logistische Entropie ist im Gegensatz zum klassischen thermodynami-
schen Entropiebegriff kein objektives physikalisches Maß. Vielmehr hängt
sie von der Modelldefinition der Zustandsbeschreibung eines konkreten
Systems ab: Wenn das Modell die Temperatur als Zustandsgröße beinhaltet
(z. B. in der Impfstofflogistik), dann muss diese Information durch Tempe-
ratursensoren erfasst und übermittelt werden. Wenn die Temperatur keine
Rolle spielt (z. B. in der Stahlträgerlogistik), dann spielt auch das Fehlen der
Temperaturinformation für die Bewertung der logistischen Entropie dieses
Systems keine Rolle.
3.4 Konzeption eines Cyberphysischen Zwillings
Das Konzept des Cyberphysischen Zwillings ist eine Spezialisierung des
Digitalen Zwillings und erweitert diesen um einige für die Logistik wichtige
Eigenschaften. Das Konzept ergänzt die Axiomatik der Logistik im Kontext
dieser Arbeit um ein allgemeinesModell von dezentralisierbaren Abbildungs-
und Steuerungssystemen für die Ausführung von logistischen Bewegungen.
Diskretisierung als Grundlage für eine Dezentralisierung der Steuerung
Die Diskretisierung von Objekten im logistischen Raum ermöglicht erst den
Einsatz einer Bewegungssteuerung. Die natürliche Verteilung von physischen
Objekten im Raum führt zu einer verteilten Zustandsinformation, sodass
3.4 Konzeption eines Cyberphysischen Zwillings 85
eine vollkommen dezentrale Betrachtung der Steuerung der grundlegende
Basisfall ist, von dem jedes Steuerungssystem abgeleitet werden muss.
Es gibt vier Diskretisierungsarten für Objekte in der Logistik:
• Physische Diskretisierung Dies können natürlich diskretisierte Artikel
sein (z. B. Stahlträger) oder eine Diskretisierung durch Ladehilfsmittel.
Die Bauform einiger Ladehilfsmittel ermöglicht eine einfache mecha-
nische Vereinzelung. Eine physische Diskretisierung des Raums kann
durch bauliche Maßnahmen wie Regale oder auch Farbmarkierungen
auf dem Boden geschehen.
• Wahrnehmende Diskretisierung Die technische Fähigkeit, physische
Objekte oder Räume voneinander trennen zu können, wird hier als wahr-
nehmende Diskretisierung betrachtet. In der Regel führt eine solche
Diskretisierung zu einer relativen Lokalisierung der Objekte oder Räume
untereinander.
• Elektronisch-kommunikative DiskretisierungWenn ein Computersys-
tem mit Kommunikationsfähigkeit in ein physisches Objekt eingebettet
wird, dann kann durch die eindeutige Kennung (z. B. MAC- oder IP-
Adresse) bei der Kommunikation eine Diskretisierung von Objekten
durchgeführt werden, die gleichzeitig zu einer Identifikation führt.
• Algorithmische Diskretisierung Datenstrukturen und Algorithmen in
existierender Software, die sich auf physische Objekte oder den logis-
tischen Raum beziehen, bestimmen die Diskretisierung während des
digitalen Abbildungsprozesses.
Damit physische Objekte im Sinne eines Digitalen Schattens automatisiert
digital abgebildet werden können, muss ein automatisiertes Identifikations-
verfahren existieren, das Objekte einzeln betrachten kann.
Abb. 3.16 Cyberphysischer Zwilling
86 3 Axiomatik der Logistik
Eigenschaften
Diese neue Klasse von Digitalen Zwillingen soll hier als Cyberphysischer
Zwilling definiert werden, der folgende zusätzliche Eigenschaften besitzt:
• Das digitale Objekt ist wichtiger als das physische Objekt, sodass alle we-
sentlichen Änderungen am Verhalten am digitalen Objekt vorgenommen
werden und das physische Objekt sein inneres Verhalten entsprechend
den Vorgaben des digitalen Objekts laufend anpasst.
• Der Übertragungsweg vom digitalen Objekt zum physischen Objekt ist
dominant und kann durch die Übertragung kompilierten Quellcodes
oder kompilierter neuronaler Netze das Verhalten des abgebildeten cy-
berphysischen Systems in der physischen Welt grundlegend ändern. Der
Übertragungsweg von der digitalen in die physische Welt ist somit mehr
als ein einfacher Datenstrom.
• Das physische Objekt ist in der Hauptsache ein Stellvertreter des digita-
len Abbilds, agiert aber weitgehend autonom mit einer lokalen Entschei-
dungsfindung.
• Das physische Objekt kann Datenverarbeitungsprozesse im virtuellen
Abbild anstoßen, wenn sich Situationen in der physischen Welt ergeben,
die eine Anpassung des Verhaltens notwendig erscheinen lassen.
• Alle Cyberphysischen Zwillinge sind in der physischen und der virtu-
ellen Welt vernetzt und bilden ein komplexes Gesamtsystem, dessen
Verhalten aus beiden Welten heraus gesteuert wird.
• Cyberphysische Zwillinge sind bezüglich ihrer logistischen Funktionen
und Attribute als mobile, physische Objekte standardisiert.
In Abbildung 3.16 wird wieder auf das Grundkonzept eines Systems von
Avataren und Agenten Bezug genommen. Es stellt verschiedene Typen Cy-
berphysischer Zwillinge in einer Silicon Economy dar, die jeweils in der
physischen und der virtuellen Welt als Agenten untereinander verhandeln,
aber zwischen den Welten über die exklusive Avatar-Verbindung kommuni-
zieren. Die Exklusivität bei dieser Weltensprung-Kommunikation sichert die
Synchronizität der beiden Objektkerne und somit die Zwillingseigenschaft
ab. Abbildung 3.17 zeigt zusammenhängende Systeme von verteilten Cyber-
physischen Zwillingen.
3.4 Konzeption eines Cyberphysischen Zwillings 87
Abb. 3.17 Systeme von verteilten Cyberphysischen Zwillingen

Kapitel 4
Anforderungen, existierende Arbeiten
und Forschungslücke
Zusammenfassung Das vierte Kapitel formuliert zunächst die Anforderun-
gen an eine kontinuierliche kinodynamische Bewegungssteuerung logisti-
scher Objekte. Diese Anforderungen dienen als Grundlage für eine Analyse
der existierenden Verfahren in der Logistik und der Robotik. Die bestehen-
den Arbeiten aus der Logistik befassen sich mit der anwendungsbezogenen
Bewegungsplanung in innerbetrieblichen Logistiksystemen. Die relevanten
Arbeiten der Robotik werden über eine Auswahl an spezifischen Schlüs-
selwörtern bestimmt, die zu den Anforderungen passen. Dies ermöglicht,
auch die Arbeiten mit in die Betrachtung einzubeziehen, die keinen logisti-
schen Anwendungsfall untersuchen. Anschließend werden die Grenzen der
existierenden Verfahren analysiert und die Forschungslücke bestimmt.
89
90 4 Anforderungen, existierende Arbeiten und Forschungslücke
4.1 Anforderungen
Die Anforderungen an eine kontinuierliche kinodynamische Bewegungs-
steuerung logistischer Objekte unter Berücksichtigung dezentraler Ausfüh-
rung dienen als Grundlage für einen Abgleich mit Forschungsarbeiten im
Betrachtungsraum dieser Arbeit. Mithilfe einer Anforderungsspezifikation
werden die Grenzen bisheriger Arbeiten strukturiert erfassbar und die For-
schungslücke sowie ihre Implikationen für die Entwicklung eines neuartigen
Verfahrens bestimmbar.
Stand der Forschung
Axiomatik Anforderungs- Logistik Forschungslücke 
der Logistik spezifikation und ihre Robotik Implikationen
Grenzen bisheriger 
Forschungsarbeiten
Abb. 4.1Weiteres Vorgehen zur Bestimmung der Forschungslücke
Die Defizite des aktuellen Forschungsstands vor dem Hintergrund der spezi-
fizierten Anforderungen offenbaren Anknüpfungspunkte für den Lösungs-
entwurf, den diese Arbeit leistet, siehe Abbildung 4.1.
Die Anforderungen an ein Verfahren werden wie folgt spezifiziert:
• Bewegungsplanung für viele Objekte Das Verfahren muss in der Lage
sein, die Bewegung für eine große Zahl an Objekten zu planen.
• Echtzeitfähige Planung für neue Objekte Bevor ein neues Objekt in den
logistischen Raum eintritt, sollte eine Bewegungsplanung innerhalb eines
vorgegebenen Zeitfensters abgeschlossen werden, sodass der physische
Bewegungsvorgang nicht durch die Zeit zur Planung verzögert wird.
• Berücksichtigung kinodynamischer Zwangsbedingungen Geschwin-
digkeit, Beschleunigung und Ruck müssen bei der Bewegungsplanung
berücksichtigt werden, sodass ein sicherer Transportvorgang gewährleis-
tet ist.
• Konfliktfreiheit inklusive Deadlockfreiheit Konflikte zwischen den Be-
wegungen verschiedener Objekte müssen vermieden werden. Das Ver-
fahren darf keine Deadlocks zulassen.
• Hohe Geschwindigkeiten und Beschleunigungen Das Verfahren muss
hohe Geschwindigkeiten und Beschleunigungen der bewegten Objekte
zulassen. Als hoch werden Geschwindigkeitswerte ab 6m/s und Be-
schleunigungswerte ab 3m/s2 angenommen.
• Unterstützung für Verfahren der quasi-kontinuierlichen Wahrneh-
mung Das Verfahren zur Bewegungssteuerung sollte in der Lage sein,
4.2 Existierende Arbeiten 91
Daten zu Position und Rotation eines Objekts in sehr kurzen Zeitabstän-
den zu verarbeiten.
• Dezentralisierbarkeit Das Verfahren zur Bewegungssteuerung sollte
dezentral ausgeführt werden können.
• Vergleichbarkeit mit der analytischen Wegzeitberechnung der Logis-
tik Damit ein Vergleich zur klassischen, analytischen Wegzeitberechnung
möglich wird, sollte diese als Spezialfall des zu entwickelnden Verfahrens
abgebildet werden können.
Der Stand der Forschung setzt sich aus bisherigen Arbeiten zur Bewegungs-
steuerung in Logistik und Robotik zusammen. Ihnen widmen sich die nach-
folgenden Abschnitte.
4.2 Existierende Arbeiten
Die existierenden Arbeiten werden getrennt nach den Themenbereichen der
Logistik und der Robotik betrachtet.
4.2.1 Logistik
Die für diese Arbeit relevanten existierenden Arbeiten stammen aus dem
Bereich der technischen Logistik und befassen sich mit der Bewegungspla-
nung in innerbetrieblichen Logistiksystemen. Allen Arbeiten ist gemein, dass
sie nicht alleine ein Verfahren theoretisch entwickeln, sondern zusätzlich
immer einen Bezug auf ein konkretes technisches System aufweisen und
häufig parallel zu diesem entwickelt wurden. Kennzeichnend für die Ent-
wicklung der Logistikforschung ist der Aufbau von kleinen Demonstratoren
in Kombination mit einer Simulation größerer Systeme.
Gitterbasierte Systeme
Einen guten Überblick über den aktuellen Stand der Forschung und der
Industrie im Bereich der gitterbasierten Steuerungsverfahren insbesondere
in der (überwiegend) deutschen Logistikforschung- und Industrie findet sich
in [Sei16]. Seibold beschreibt die Arbeiten, die auf der Entwicklung des Flex-
Conveyors aufbauen, eines modularen, gitterbasierten Stetigfördersystems,
das Behälter mithilfe quadratischer Transfermodule in alle vier Richtungen
transportieren kann. Dieses System kann durch sogenannte Deadlock-Tokens
bestimmte Konfliktsituationen vermeiden, die durch zirkuläre Wartebezie-
hungen ausgelöst werden. Es werden weitere gitterbasierte Systeme beschrie-
ben: der GridSorter für Sortiersysteme [Fle21], der GridStore als Lagersystem
[Gue+14] sowie GridPick als Kommisioniersystem [Ulu14].
Seibold entwickelt in ihrer Arbeit einen Algorithmus, der das Routing auf
Basis von logischer Zeit durchführt. Dies ermöglicht eine Reduktion kinody-
namischer Bewegungsmodelle auf die ereignisdiskrete Wahrnehmungsfä-
92 4 Anforderungen, existierende Arbeiten und Forschungslücke
higkeit des Systems. Folglich wird das Steuerungssystem unabhängig von
den tatsächlichen Transportzeiten der einzelnen Transfermodule. Durch die
Verwendung von logischer Zeit ergibt sich ein natürlicher Weg zur Dezentra-
lisierung der Steuerung, da die ursprüngliche Veröffentlichung von Lamport
die Synchronisation verteilter Systeme thematisiert.
Das System GridFlow vewendet Transportfahrzeuge, die in einem dich-
ten, gitterbasierten Bodenblocklager Paletten transportieren können. Dazu
stehen die Paletten auf unterfahrbaren Gestellen, sodass die Fahrzeuge sich
unabhängig von den Paletten gitterbasiert bewegen können. Das System
vermeidet Deadlocks und Livelocks auf Basis einer globalen Priorisierung
der Fahrzeuge (vgl. [SF20]).
Das Amazon Kiva System ist ein weiteres gitterbasiertes Transportsystem
mit Transportrobotern (vgl. [WDM08]). Es kombiniert ein Lagersystem auf
Basis von beweglichen Regalen mit dem Transport der Regale zu Kommissio-
nierstationen. Der Steuerungsalgorithmus wurde wissenschaftlich publiziert
und führte zu einer Viezahl von weiteren Publikationen in den folgenden
Jahren. Insbesondere die formalen Definitionen vonMulti-Agent Pathfinding
(MAPF) undMulti-Agent Pickup and Delivery (MAPD) lassen sich auf dieses
System zurückführen (vgl. [SS20]). Dabei wurde mit Conflict-based Search
(CBS) ein optimaler Algorithmus für die Bewegungsplanung in dieser Sys-
temklasse gefunden (vgl. [Sha+15]). Dieser Algorithmus benötigt dabei alle
Transportaufträge als Eingabe und berechnet ein optimales Scheduling der
Bewegungen der Transportroboter. Eine laufende Eingabe neuer Aufträge ist
nicht vorgesehen, und es werden keine kinodynamischen Zwangsbedingun-
gen bei der Bewegungsplanung berücksichtigt. Wie bei allen gitterbasierten
Systemen muss der Roboter vor einer Richtungsänderung im Stillstand sein.
Eine vollkommen dezentrale Steuerung ist möglich, sie bringt für die Vor-
ausberechnung aller Bewegungen keinen direkten Mehrwert, da keine lokale
Entscheidungsfindung durchgeführt wird. Das System basiert auf einer Lo-
kalisierung durch eine Matrix von Barcodes, die auf dem Boden angebracht
werden und die von den Robotern zur Lokalisierung gelesen werden. In
den folgenden Jahren entstand eine Reihe von ähnlichen Systemen anderer
Anbieter (vgl. [Wur17]).
Allen gitterbasierten Systemen ist gemein, dass sie eine dichte, infrastruk-
turbasierte Struktur abbilden, bei denen der Vermeidung von Deadlocks
besondere Bedeutung bei der Bewegungsplanung zukommt. Die Wahrneh-
mung beschränkt sich auf ein ereignisdiskretes Informationsmodell, das den
Eingang und Ausgang eines Förderguts oder Transportroboters in Bezug auf
eine Gitterzelle abbildet.
4.2 Existierende Arbeiten 93
Verfahren unter Berücksichtigung kinodynamischer
Zwangsbedingungen
In der Regel werden kinodynamische Zwangsbedingungen in der Bewe-
gungsplanung logistischer Systeme nur auf der Ebene der individuellen
Auslegung der Maximalgeschwindigkeit eines Systems berücksichtigt. Dies
kann z. B. die Fahrkurvenplanung eines Regalbediengerätes sein, bei der
ein sanftes Beschleunigen und Bremsen zur Vermeidung von Ruck führt.
Eine weitere Gegenmaßnahme aus der logistischen Praxis ist eine geeignete
mechanische Ladungssicherung oder ein Ladehilfsmittel zur Vermeidung
des Herunterfallens von Gegenständen (vgl. [tSD18]).
Fahrerlose Transportsysteme
Die wissenschaftliche Literatur zu klassischen Fahrerlosen Transportsyste-
men (FTS) beschreibt Problemstellungen, die auf festgelegten Straßenkarten
basieren. Moderne Entwicklungen in diesem Bereich stützen sich auf Ent-
wicklungen der Robotik, sodass sich hier die existierenden Arbeiten auf
Anwendung existierender Roboter beschränken (vgl. [DVD20]). Im Kontext
dieser Arbeit wird ein FTS als Roboter in einer logistischen Anwendung
gesehen.
Industrielle Entwicklungen und Systeme
Es gibt zahlreiche industrielle Entwicklungen, über die keine detaillierten
Veröffentlichungen über die Bewegungsplanung existieren. In vielen Fällen
kann aufgrund von Werbematerial (insbesondere Videos) auf bestimmte Ver-
fahren geschlossen werden. Dies ist z. B. bei gitterbasierten Verfahren sehr
gut zu erkennen. Generell konnte im Rahmen dieser Arbeit kein industri-
elles System gefunden werden, welches augenscheinlich den spezifizierten
Anforderungen, insbesondere einer freien Orientierung der Fahrzeuge bei
gleichzeitig hohen Geschwindigkeiten, genügt.
4.2.2 Robotik
Die theoretischen Grundlagen der Bewegungsplanung aus der Robotik wur-
den in dieser Arbeit bereits ausführlich dargestellt. Die folgenden Arbeiten
beziehen sich daher auf die spezifischen Anforderungen, die sich für die
Bewegungsplanung im idealen logistischen Raum ergeben.
Es gibt einige Besonderheiten bei der Literaturrecherche im Bereich Robo-
tik, die sich für diese Arbeit ergeben. Aus Sicht der Robotik ist die Logistik
lediglich eins von vielen Anwendungebieten, in denen Roboter zum Einsatz
kommen können. Das bedeutet, dass die einfache Suche nach wissenschaft-
lichen Veröffentlichungen mit Logistikbezug nicht zu einem umfassenden
Bild der relevanten Literatur führt. Viele Veröffentlichungen, die Verfahren
der Bewegungsplanung betreffen, werden nicht für eine Logistikanwendung
94 4 Anforderungen, existierende Arbeiten und Forschungslücke
entwickelt und so bei einer einfachen Suche mit dem Begriff Logistik nicht
gefunden.
Eine weitere Problemstellung ist von weitaus grundsätzlicherer Natur:
Selbst aus Sicht der klassischen Logistik stellen Roboter nur ein mögliches
Gewerk unter vielen dar. So kommen Greifarmrobotor etwa bei der Kommis-
sionierung zum Einsatz, und das weite Feld der Transportroboter fällt unter
den Bereich der Unstetigfördertechnik oder der FTS. Es gibt bislang keine
Veröffentlichung, die sich mit dem allgemeinen Thema einer frei-orientierten
Bewegungsplanung für logistische Objekte befasst, die unabhängig von ei-
nem konkreten technischen System ist.
Es werden daher in den Ergebnissen der Literaturrecherche die Begriffe
der Robotik verwendet, die zu den spezifizierten Anforderungen passend
sind. Dazu werden im Folgenden die englischsprachigen Begriffe genannt,
die zur Auffindung relevanter Veröffentlichungen der Robotik geführt haben:
• Multi-Robot Veröffentlichungen, die eine Vielzahl von Robotern betref-
fen
• Swarm Veröffentlichungen, die sich mit einer Schwarmsteuerung von
Robotern befassen
• Kinodynamic Veröffentlichungen, die sich mit kinodynamischer Bewe-
gungsplanung befassen
• Lifelong Planning Veröffentlichungen, die sich mit einer Bewegungspla-
nung befassen, die neue Objekte oder Aufträge während der Ausführung
berücksichtigen kann
Weitere Anforderungen wie Deadlockfreiheit und die erreichten Geschwin-
digkeiten, die in der Praxis getestet wurden, lassen sich in der Regel nicht
durch den Titel bestimmen, sondern finden sich im Volltext oder sind eine
implizite Eigenschaft der untersuchten Methode (wie z. B. bei Conflict-based
Search).
Es lässt sich feststellen, dass es eine deutlich größere Anzahl von Veröf-
fentlichungen in der Robotik als in der technischen Logistik gibt, was auf die
deutlich größere Anzahl an Wissenschaftlern zurückzuführen ist, die sich
mit Robotik im Allgemeinen befassen.
Gitterbasierte Verfahren mit Logistikbezug
Eine Ausnahme von der Regel, dass Veröffentlichungen zur Bewegungspla-
nung in der Robotik keinen direkten Bezug zur Logistik haben, lässt sich im
Fall der gitterbasierten Verfahren feststellen. Aus einer Veröffentlichung über
die Entwicklung des Amazon Kiva Systems ist ein eigener Forschungsbereich
der Robotik geworden, der auf einer Formalisierung der Problemstellung
basiert, die mit MAPD einen eigenen Begriff bekommen hat (vgl. [WDM08])).
4.2 Existierende Arbeiten 95
Dabei handelt es sich bei MAPD im Grunde um eine altbekannte Problem-
stellung der Unstetigfördertechnik, die Lastfahrten und Leerfahrten betrifft.
Es wurde in der Robotik für diese Art gitterbasierte Systeme einen neue
Begrifflichkeit und ein neues Themengebiet geschaffen.
Ein Effekt der Formalisierung des Kiva Systems als MAPD ist die Fest-
schreibung spezifischer Eigenschaften des praktischen Systems, an denen
sich fast alle weiteren Arbeiten als Randbedingungen halten: das gitterba-
sierte Bewegungsmodell, der zeitliche Gleichschritt aller Bewegungen in die
nächste Gitterzelle, keine Berücksichtigung individueller Geschwindigkeiten
und die labyrinthartigen Layouts mit einem Manhattan-Straßenmodell (vgl.
[SS20]).
Wie bereits oben beschrieben, existiert mit CBS ein effizienter, optimaler
Algorithmus für die Lösung von MAPF (vgl. [Sha+15]). Er kombiniert eine
A∗-Suche mit dem geschickten Einsatz eines binären Suchbaums, der die
Konfliktfälle speichert, in denen zwei Roboter die gleiche Gitterzelle zum
gleichen Zeitpunkt belegen wollen. Über diesen Suchbaum werden die Prio-
ritätsmöglichkeiten, nach denen ein Roboter auf den anderen warten muss,
für jeweils beide Fälle betrachtet. Damit kann eine günstige Zuweisung von
Prioritäten erreicht und die Gesamtleistung des Systems optimiert werden.
Damit steht er im Gegensatz zum Verfahren mit logischer Zeit aus der Ar-
beit von Seibold, das keine Optimalität für das Gesamtsystem garantiert.
Die optimale Bewegungsplanung von CBS efordert jedoch die Eingabe aller
Transportanfragen vor Start der Bewegungsplanung und kann damit nicht
auf neu hinzukommende Anfragen reagieren. Das Verfahren ist besonders
für Szenarien geeignet, für die keine neuen Transporte während der Ausfüh-
rung des optimalen Bewegungsplans erforderlich sind und die eine dichte
Hindernisregion besitzen, die wenig Ausweichmöglichkeiten bietet, sodass
die optimale Zuweisung von Prioritäten von Vorteil ist.
Schwarmverfahren
Verfahren der Bewegungsplanung auf Basis von Schwarmalgorithmen be-
trachten den Roboter als holonomisch agierenden Partikel, der einen Ge-
schwindigkeitsvektor besitzt, dessen Werte durch verschiedene Regeln lau-
fend neu berechnet werden (Feedback Planning). Die Wahrnehmung des
einzelnen Roboters ist dabei auf seine lokale Nachbarschaft beschränkt, in
der er die Bewegungen anderer Roboter kontinuierlich beobachtet. Die Ge-
schwindigkeitsvektoren der Nachbarn werden bei der Neuberechnung des
eigenen Vektors so berücksichtigt, dass keine Konflikte auftreten. Die cha-
rakteristische Eigenschaft von Schwarmverfahren ist, dass alle Partikel die
Regeln kennen, nach denen sie sich Verhalten (Reziprozität). Mit dem Verfah-
ren der Reciprocal Velocity Obstacles (RVO) existiert ein heuristisches Verfah-
ren, das diesen Umstand zur Bewegunsgplanung verwendet (vgl. [vLM08]).
Aufbauend darauf wurden die ORCA Lines als Methode entwickelt und
96 4 Anforderungen, existierende Arbeiten und Forschungslücke
nachgewiesen, dass eine konfliktfreie Bewegung beliebig vieler Teilnehmer
garantiert werden kann, wenn der Geschwindigkeitsvektor unbeschränkt ist
(vgl. [van+11a]).
Alle Schwarmverfahren verwenden eine lokal beschränkte Wahrnehmung
und antizipieren die Bewegung anderer Teilnehmer nur über einen be-
schränkten Zeithorizont. Damit sind sie nicht in der Lage, globale Deadlock-
bedingungen zu verhindern. Bei einer Berücksichtigung kinodynamischer
Zwangsbedingungen verliert das ORCA-Verfahren seine Garantie auf Kon-
fliktfreiheit, da Situationen entstehen können, die eine plötzliche sehr hohe
Geschwindigkeitsänderung erfordern. Bei hohen Geschwindigkeiten besteht
für jedes Schwarmverfahren die Herausforderung, einen Eintritt in die Zone
der unvermeidlichen Kollision zu erkennen und zu verhindern.
Kinodynamische Verfahren für einzelne Roboter
Die Entwicklung effizienter Verfahren unter Berücksichtigung kinodyna-
mischer Zwangsbedingungen gilt selbst für einzelne Roboter bis heute als
Herausforderung in der Robotik. Der Grund liegt in der großen Anzahl
an zusätzlichen Zuständen, die von einem Verfahren potenziell betrachtet
werden müssen. Das Ziel kinodynamischer Verfahren ist, eine zeitoptimale
Pfadplanung zu erreichen, die nicht unbedingt den kürzesten Pfad verwen-
det, sondern einen, der hohe Geschwindigkeiten ermöglicht. Dazu sollten
Pfade vermieden werden, die ungünstige Zwangsbedingungen erzeugen,
wie sie z. B. durch rechte Winkel entstehen (siehe Abschnitt 2.4.6).
Bei einer entkoppelten Planung wird zuerst ein Pfad generiert, für den im
zweiten Schritt ein Geschwindigkeitsprofil gebildet wird. Für die Erzeugung
günstiger Pfade kann auf die besonderen Eigenschaften von Splines zurück-
gegriffen werden, die es erlauben, Geschwindigkeiten und Beschleunigung
langsam ansteigen zu lassen und ruckartige Bewegungen verhindern. Für die
Bewegungsplanung einzelner Roboter wurde dies mit Hilfe von Bézierkur-
ven fünfter Ordnung erforscht (vgl. [LSB09]). Ein Vorteil von Splines ist, dass
Pfade durch wenige Kontrollpunkte und Parameter repräsentiert werden.
Mit dem Timed-Elastic-Bands-Verfahren (TEB) können zeitoptimale Pfa-
de auch für nicht-holonomische Roboter effizient berechnet werden (vgl.
[Roe+12]). Ein TEB wird als Problemstellung einer gewichteten multikriteri-
ellen Optimierung abgebildet. Die meisten Kriterien sind lokal, was zu einer
spärlichen Systemmatrix führt, für die es effiziente Lösungsansätze auf Basis
Methode der kleinsten Quadrate gibt.
Kinodynamische Multi-Roboter-Verfahren
Die Problemstellung kinodynamischer Multi-Roboter-Verfahren kombiniert
die Komplexität beider Einzelproblemstellungen, sodass bislang keine global
optimalen Algorithmen existieren.
4.3 Grenzen existierender Verfahren 97
Ein Ansatz der Komplexitätsreduktion basiert auf einer globalen Pla-
nung ohne Konfliktbehandlung zur Generierung von Wegpunkten, die an-
schließend über eine dynamische lokale Planung angefahren werden. In
[Gar19] wird ein solches Verfahren verwendet, um frei-orientierte FTS in
einer Fabrikumgebung zu steuern. Die lokale Planungsmethode ist eine
Variante von TEB und wurde in der Praxis mit einer beschränkten Wahrneh-
mung von 15m x 15m, einem Zeithorizont von 20s und einer translationalen
Geschwindigkeit von 1m/s durchgeführt. Damit ist es möglich, dass sich
Fahrzeuge lokal ausweichen können, wenn genügend Platz zur Verfügung
steht.
Eine weitere Arbeit beschäftigt sich mit der Bahnplanung von Drohnen-
schwärmen und setzt dazu eine angepasste Variante des Rapidly-Exploring-
Random-Tree-Verfahrens (RRT) ein (vgl. [CKV21]).
Das Safe-Intervall-Path-Planning-Verfahren (SIPP) reduziert die Komplexi-
tät der Konfliktlösung unter Robotern durch die Bestimmung von Raum-Zeit-
Intervallen, in denen eine Kollision vermieden werden muss (vgl. [PL11]).
Durch die Beschränkung auf diese Konfliktintervalle wird die Anzahl an
Operationen, die für eine Konfliktvermeidung durchgeführt werden müssen,
effizient reduziert.
Allen Arbeiten im Bereich der kinodynamischen Mutli-Roboter-Verfahren
ist gemein, dass sie in Praxis und Simulation relativ wenige Roboter betrach-
ten (häufig weniger als 10, üblicherweise nicht mehr als 30). Ein Grund liegt
in der mit der Anzahl an Robotern ansteigenden Komplexität der notwendi-
gen Berechnungen.
4.3 Grenzen existierender Verfahren
In den folgenden Unterabschnitten werden die Grenzen der bisherigen Ar-
beiten in Robotik und Logistik zusammengefasst und die Forschungslücke
bestimmt, die Thema dieser Arbeit ist. In Bezug auf die spezifizierten An-
forderungen können die Grenzen der bisherigen Arbeiten in die folgenden
Aspekte strukturiert werden.
Grenzen gitterbasierter Systeme und Verfahren
In den letzten zehn Jahren gab es grundlegende Entwicklungen im Bereich
gitterbasierter Systeme (Kiva, FlexConveyor, Flexsorter usw.) mit einer größe-
ren Anzahl an wissenschaftlichen Veröffentlichungen. Dabei wird die Bewe-
gungsplanung für viele Objekte bzw. Roboter betrachtet und insbesondere
der Aspekt der Deadlockfreiheit bei der Konfliktvermeidung thematisiert.
Die Grenzen liegen in der gitterbasierten Struktur, die eine grundsätzlich
ungünstige Rahmenbedingung für eine kinodynamische Bewegungsplanung
darstellt: Bei jeglichen Richtungswechseln muss das Objekt oder der Roboter
zum Stillstand kommen. Dies vermindert die Durschnittsgeschwindigkeit.
98 4 Anforderungen, existierende Arbeiten und Forschungslücke
Diese grundlegende Begrenzung führt im idealen, leeren logistischen Raum
zu unnötigen Leistungsverlusten. Aus axiomatischer Sicht sind gitterbasierte
Verfahren immer dann geeignet, wenn es sich um Systeme handelt, die dem
idealen Lagerwesen nahestehen, da hier eine gitterbasierte Struktur natürli-
cherweise durch standardisierte Logistikobjekte gegeben ist. Für das ideale
Förderwesen sind sie grundsätzlich ungeeignet.
Grenzen existierender kontinuierlicher Bewegungsplanung in der
Logistik
Wenn kontinuierliche Bewegungsplanung aus der Robotik in der Logistik
eingesetzt wird, dann nur in der konkreten Anwendung eines Unstetigförder-
systems in Form von FTS. Die Bewegungsplanung beschränkt sich hier auf
das Roboter-Subsystem und es wird nicht der übergreifende Materialfluss
geplant. Die Arbeiten beschränken sich auf die klassischen Anwendungsbe-
reiche von FTS, wie z. B. in der Produktionsversorgung, und verbessern dort
die bekannten Steuerungsmechanismen. Eine Substitution von Stetigförder-
systemen im Allgemeinen wird nicht berücksichtigt. Die Berücksichtigung
kinodynamischer Zwangsbedingungen findet vor allem durch Vorgabe nied-
riger Maximalgeschwindigkeiten statt, die in den typischen Anwendungsbe-
reichen von FTS durch die Sicherheit in der Mensch-Maschine-Interaktion
zusätzlich vorgegeben ist. Eine Verfahren mit hohen Beschleunigungen und
Geschwindigkeiten wurde daher bislang nicht untersucht. Bislang existiert
keine allgemeine Theorie der Bewegungsplanung in der Logistik, die ein
kontinuierliches Weltmodell berücksichtigt. Ein möglicher Grund dafür ist,
dass bislang eine industrietaugliche kontinuierliche Wahrnehmungsfähigkeit
nicht existiert, die für eine technische Umsetzung einer kontinuierlichen Be-
wegungsplanung notwendig wäre. Grundlegende Konzepte aus der Robotik,
wie der Konfigurationsraum, sind bislang der Logistiktheorie nicht bekannt.
Die Robotik wird als Wissenschaft für spezielle Transportsysteme gesehen,
die mit der allgemeinen Materialflussplanung keine Überschneidungspunkte
besitzt.
Grenzen von Schwarmverfahren
Schwarmverfahren werden durch ihre lokale Wahrnehmung und ihren li-
mitierten Zeithorizont begrenzt. Dies ermöglicht zwar eine effiziente lokale
Bewegungssteuerung, jedoch verhindert es in der Praxis hohe Geschwindig-
keiten bei gleichzeitig enger Trajektorienführung. Der begrenzte Zeithorizont
führt zu der theoretischen Möglichkeit für globale Deadlockzustände. Die
kinodynamischen Zwangsbedingungen realer Roboter lassen sich nur bei
geringen Geschwindigkeiten durch klassische Schwarmverfahren einhalten.
4.4 Forschungslücke 99
Grenzen existierender Multi-Roboter-Verfahren
Die Grenzen existierenderMulti-Roboter-Verfahren sind nicht grundlegender
Natur, sondern lassen sich durch eine gewisse Ignoranz der Robotikwissen-
schaften gegenüber zukünftigen Logistikanwendungen erklären. Die grund-
legende Bewegungsplanung für bekannte Umgebungen gilt als weitgehend
gelöst, auch wenn kein effizientes allgemeingültiges Planungsverfahren für
Multi-Roboter-Systeme mit kinodynamischen Zwangsbedingungen existiert.
Eine Ursache der im Vergleich zu gitterbasierten Systemen fehlenden Ver-
öffentlichungen liegt vermutlich in der Abwesenheit einer eindrucksvollen
Logistikanwendung im kontinuierlichen Raum, deren Problemstellung aus
Sicht eines Robotikwissenschaftlers fruchtbar ist. Existierende Veröffentli-
chungen nehmen daher Bezug entweder auf Robotersysteme, die im Umfeld
einer Universität selbst gebaut werden, oder auf relativ günstige Systeme, die
frei am Markt erhältlich sind. Dementsprechend konzentrieren sich aktuelle
Verfahren auf Drohnenschwärme oder selbstgebaute Multi-Roboter-Systeme
mit wenigen Einheiten. Verfahren für hohe Geschwindigkeiten werden im
Kontext autonomer Fahrzeuge im Straßenverkehr betrachtet (hier werden
schnelle Modellautos verwendet). Ein weiterer Grund ist das Fehlen existie-
render Sensorik für eine kontinuierliche Wahrnehmung in aktuell verfügba-
ren Systemen.
Die Folge ist, dass kein veröffentlichtes Verfahren existiert, das alle An-
forderungen dieser Arbeit in Bezug auf eine große Anzahl von Objekten,
die sich mit hoher Geschwindigkeit unter Berücksichtigung kinodynami-
scher Zwangsbedingungen deadlockfrei im hindernisfreien Raum bewegen,
erfüllt.
4.4 Forschungslücke
Die Forschungslücke ergibt sich aus der Erkenntnis, dass für das idealisierte
Förderwesen, das durch den idealen (leeren) logistischen Raum repräsentiert
wird, kein allgemeines Verfahren zur kinodynamischen Bewegungsplanung
existiert. Aus Sicht einer Axiomatik der Logistik würde durch das Schließen
dieser Lücke, zusammen mit den gitterbasierten Verfahren für das idealisier-
te Lagerwesen, eine prinzipiell vollständige Beschreibung der logistischen
Bewegungsplanung entstehen.
Eine Implikation für die Verfahrensentwicklung ist, dass die Suche nach
einem geeigneten Verfahren insbesondere den Nachweis für die Durchführ-
barkeit in einem allgemein gültigen, archetypischen Anwendungsfall des
Förderwesens bedeutet, nicht die Suche nach Optimalität im Sinne der Robo-
tikwissenschaften.
Es gilt, ein Verfahren zu finden, dass durch Verwendung der am einfachs-
ten zu verstehenden notwendigen Methoden und Bausteine die Leistung
eines klassischen Logistiksystems erreicht oder übertrifft. Wünschenswert
100 4 Anforderungen, existierende Arbeiten und Forschungslücke
wäre zudem eine gute Vergleichbarkeit oder Herleitungsfähigkeit aus der
analytischen Wegzeitberechnung der Materialflussplanung als Anküpfungs-
punkt und Grundlage zur Entwicklung einer erweiterten Logistiktheorie.
Kapitel 5
Verfahren zur kinodynamischen
Bewegungsplanung
Zusammenfassung Das fünfte Kapitel erarbeitet den Lösungsentwurf dieser
Arbeit, ein Verfahren zur kontinuierlichen, kinodynamischen Bewegungs-
steuerung logistischer Objekte in der innerbetrieblichen Logistik. Zunächst
wird die Gestaltung des idealen logistischen Raums betrachtet und die Pro-
blemstellung formal definiert. Dem schließt sich die Beschreibung der Be-
standteile und des Verfahrensablaufs an. Dabei werden die Faktoren Durch-
führbarkeit, Dezentralisierbarkeit und Echtzeitfähigkeit betrachtet. Im wei-
teren Verlauf wird detailliert auf splinebasierte Trajektorien eingegangen
und es wird eine geeignete Spline-Familie ausgewählt. Die Abbildung der
kinodynamischen Eigenschaften der Bewegungsplanung erfolgt durch ein
numerisches Geschwindigkeitprofil, dessen Struktur die Basis für die Bestim-
mung der Geschwindigkeiten auf der Trajektorie ist. Dieses Vorgehen bildet
die Grundlage für die Erweiterung des Verfahrens auf eine kollisionsfreie
Bewegungsplanung für mehrere Objekte.
101
102 5 Verfahren zur kinodynamischen Bewegungsplanung
5.1 Gestaltung des idealen logistischen Raums
Die weitere Struktur dieser Arbeit ist auf die Bestandteile und den Ablauf
des Verfahrens zur Bewegungsplanung im idealen logistischen Raum ausge-
richtet. Neben der Beschreibung des Verfahrens wird ein Bewertungsrahmen
für die empirische und simulative Evaluation entwickelt.
Die folgenden Abschnitte beschreiben den idealen logistischen Raum mit
seinen Eigenschaften und die Bestandteile des Verfahrens in einer Übersicht.
Dabei wird auf die Erfüllung der Anforderungen aus Abschnitt 4.1 einge-
gangen und auf die grundlegenden Methoden in Abschnitt 2.4 verwiesen.
Anschließend folgt eine detaillierte Beschreibung der Algorithmen, die das
Verfahren umsetzen.
Die besonderen Eigenschaften des idealen logistischen Raums sind das
Fehlen von statischen Hindernissen, ein kontinuierlicher Konfigurations-
raum und eine Notwendigkeit, die Bewegungen von vielen Objekten koordi-
nieren zu müssen. Da keinerlei Lagerung stattfindet, kommen neue Objekte
nur von außerhalb des Raums hinein und verlassen den Raum nach Ab-
schluss der Bewegung wieder. Daraus folgt, dass sich Quellen und Senken
von Bewegungsvorgängen ausschließlich an den Rändern des Raums befin-
den (siehe Randpunkte in Abschnitt 2.4.3). Abbildung 5.1 zeigt ein Beispiel
eines idealen logistischen Raums mit zwei Quellen und zwei Senken.
q s‘
q‘
s
Abb. 5.1 Bewegung zweier Objekte im idealen logistischen Raum
Die formale Problemstellung im idealen logistischen Raum ähnelt der in Un-
terabschnitt 2.4.5 beschriebenen Problemstellung für die Bewegungsplanung
mehrerer Objekte. Der Unterschied ist, dass es keine statische Hindernis-
region O ⊂W gibt, der kontinuierliche Pfad τ : [0,1]→Z f ree als Ergebnis
der Planung zusätzlich kinodynamischen Zwangsbedingungen genügen
5.1 Gestaltung des idealen logistischen Raums 103
muss und die Start- und Zielpunkte am Rand des Raums liegen und auf fest
definierte Quellen und Senken beschränkt sind.
Die Entwicklung eines vollständigen Algorithmus für die Planung im
idealen logistischen Raum hat die Herausforderung, dass die Anzahl der
Objekte die Dimension des Zustandsraums Z linear wachsen lässt und dass
die anspruchsvolle Planung unter kinodynamischen Zwangsbedingungen
zusätzlich erforderlich ist (vgl. Unterabschnitt 2.4.6). Schon die Standardpro-
blemstellung für kinodynamische Planung ist PSPACE-hart und die Planung
für mehrere Objekte hat im besten Fall eine exponentielle Laufzeit. Folg-
lich wird das Verfahren in dieser Arbeit als stichprobenbasierter Algorith-
mus entwickelt, der nach den Prinzipien der priorisierten und entkoppelten
(Trajektorien-)Planung arbeitet (vgl. Abschnitt 2.4.5 und Abschnitt 2.4.6).
q
s
q‘
Abb. 5.2 Last- und Leerfahrt eines Transportroboters im idealen logistischen Raum
In Abbildung 5.2 ist die Bewegungsplanung im idealen logistischen Raum
unter Nutzung eines Transportroboters skizziert. In diesem Fall handelt es
sich zusätzlich um eine MAPF-Problemstellung (vgl. Abschnitt 2.4.2). Die
Bewegungsplanung erfolgt nicht mehr für die Objekte, sondern für eine feste
Anzahl an Transportrobotern, die dauerhaft im System verbleiben und die
Objekte von den Quellen zu den Senken transportieren. Jeder Auftrag besteht
prinzipiell aus einer Leerfahrt ohne Objekt zur Quelle (Pickup) und einer
Lastfahrt mit Objekt zur Senke (Delivery). Wie in der Abbildung zu sehen ist,
wird dieser Ablauf für den idealen logistischen Raum so modifiziert, dass
die Roboter in Warteschlangen an den Quellen auf Objekte warten, diese
in einer Lastfahrt zur Senke tranportieren (durchgezogene Linie) und an-
schließend in einer Leerfahrt zu einer beliebigen Warteschlange weiterfahren
(gestrichelte Linie). Die Warteschlangen befinden sich außerhalb des Raums
an seinen Rändern. Ihre gemeinsame Kapazität ist mindestens so groß, dass
104 5 Verfahren zur kinodynamischen Bewegungsplanung
sich alle Transportroboter gleichzeitig in einer Warteschlage befinden können
(Initialzustand, der Raum ist leer).
Die Warteschlagen außerhalb des Raums bilden eine sichere Garagenkonfi-
guration, wie sie in Abschnitt 2.4.5 beschrieben wird. Ein Transportroboter
in der Warteschlange ist von der allgemeinen Bewegungsplanung ausge-
nommen, da er weder Konflikte erzeugt noch durch andere Roboter gestört
wird. Sobald der vorderste Roboter die Warteschlange verlässt, rücken alle
anderen Roboter automatisch auf. Der vorderste Roboter ist der einzige, der
die Warteschlange verlassen kann, sobald seine Bewegungsplanung erfolgt
ist. Gleichzeitig kann er beliebig lange warten, bevor er losfährt. Sobald
ein Roboter losgefahren ist, kann er sicher sein, dass ein Platz in der Ziel-
Warteschlange reserviert ist. Mit dieser Gestaltung ist eine Deadlock- und
Livelockfreiheit des Verfahrens gesichert.
Wie in Abbildung 5.1 und Abbildung 5.2 angedeutet, kann der ideale
logistische Raum eine beliebige Form annehmen. Es gelten grundsätzlich alle
Eigenschaften für Räume in der kontinuierlichen Bewegungsplanung, wie
sie in Unterabschnitt 2.4.3 beschrieben werden. Insbesondere gilt dies für die
grundlegenden topologischen Konzepte, die in Abschnitt 2.4.3 beschrieben
werden. Der ideale logistische Raum ist pfadzusammenhängend, und durch
das Fehlen einer statischen Hindernisregion sind alle Pfade mit gleicher
Quelle und Senke homotop.
Für die Mehrzahl der praktischen Anwendungen in der Logistik wird
intuitiv angenommen, dass der ideale logistische Raum eine größere freie
Fläche beinhaltet, auf der sich Objekte oder Roboter frei bewegen und einan-
der einfach ausweichen können. Diese Annahme wird in dieser Arbeit nicht
formalisiert, da das Verfahren auch für alle Spezialfälle eine durchführbare
Bewegung planen kann. Jedoch basieren die heuristischen Teile des Verfah-
rens zur Konfliktvermeidung auf dem Vorhandensein einer größeren freien
Fläche im Raum.
5.2 Bestandteile und Ablauf des Verfahrens
Die Problemstellung der gleichzeitigen Bewegung vieler Objekte wird über den
Ansatz der priorisierten Planung, der in Abschnitt 2.4.5 beschrieben wird,
gelöst. Allen Objekten wird eine Priorität zugeordnet. Die Bewegungspla-
nung wird nach absteigender Priorität für die Objekte einzeln durchgeführt.
Für Objekte niedriger Priorität werden die Objekte höherer Priorität als
dynamische Hindernisse berücksichtigt. Diese Priorisierung wird in die-
sem Verfahren durch eine Datenstruktur abgebildet, die das Verhalten einer
FIFO-Warteschlange hat. In Abbildung 5.3 ist das grundsätzliche Verhalten
illustriert. Ein Objekt beginnt den Prozess der Bewegungsplanung, wenn es
sich an einer Quelle am Rand außerhalb des Raums befindet. Der Prozess der
Bewegungsplanung wird am Ende der Warteschlange eingefügt und erhält
5.2 Bestandteile und Ablauf des Verfahrens 105
Informationen über alle bereits geplanten Bewegungen, die sich vor ihm in
der Warteschlange befinden. Sobald die individuelle Bewegungsplanung
abgeschlossen ist, steht das Ergebnis der Planung nachfolgenden Prozessen
solange zur Verfügung, bis das Objekt den Raum an der Senke verlassen hat.
q s‘
q‘
s
Abb. 5.3 Datenstruktur der Bewegungskoordination
Die Planung der individuellen Bewegung eines Objekts folgt dem Prinzip
der entkoppelten Planung, wie es für die Trajektorienplanung in Abschnitt 2.4.6
beschrieben ist, und verbindet diesen Ansatz mit dem induktiven Vorgehen
der priorisierten Planung für mehrere Objekte. Die formale Darstellung des
resultierenden Planungsproblems kann aus einer Kombination der formalen
Problemstellungen in Unterabschnitt 2.4.5 und Unterabschnitt 2.4.6 gebildet
werden:
• ein WeltmodellW ∈R2 des idealen logistischen Raums
• ein unbegrenztes Zeitintervall T = [0,∞)
• das aktuell betrachtete Objekt Ai
• ein Konfigurationsraum C
• ein Zustandsraum Z , der als differenzierbare Mannigfaltigkeit definiert
ist und der Z = C oder als abgeleiteter Phasenraum von C definiert
werden kann
• die Zustandstrajektorien z̃1, . . . , z̃i−1 der bereits geplanten Objekte
A1, . . . ,Ai−1
• eine zeitabhängige Hindernisregion Zobs(t), die alle Zustände
z̃1(t), . . . , z̃i−1(t) enthält, die zum Zeitpunkt t von den bereits geplanten
Objekten eingenommen werden
106 5 Verfahren zur kinodynamischen Bewegungsplanung
• der zeitabhängige freie Zustandsraum Z f ree(t) = Z\Zobs(t), der alle
Zustände eines Zeitpunkts t enthält, die Kollisionen vermeiden und alle
kinodynamischen Zwangsbedingungen einhalten
• Für jeden Zustand z ∈ Z gibt es einen beschränkten Aktionsraum
U(z) ⊆ Rm ∪ {uT} mit m als feste Anzahl an Aktionsvariablen und uT
als Terminierungsaktion. Sei U die Vereinigung aller U()z) über alle
z ∈ Z .
• eine Zustandsübergangsgleichung ż = f (z,u), die für alle z ∈ Z und
u ∈U()z) definiert ist
• ein Initialzustand zq aus der Menge aller Quellen
• ein Zielzustand zs aus der Menge aller Senken
Der Algorithmus berechnet eine Aktionstrajektorie ũ : T→U, aus der eine
Zustandstrajektorie z̃ gebildet werden kann, bei der z(0) = zs ist, für die
ein t > 0 mit u(t) = uT existiert und für die es ein z(t) = zs gibt. Die Ge-
schwindigkeitsvektoren werden für z(0) als null angenommen, das Objekt
beginnt die Bewegung im Stillstand. Sobald uT ausgeführt wird, bleibt der
erreichte Zustand unverändert. Dabei wird angenommen, dass auch die
Geschwindigkeitsvektoren in zs null sind, sodass das physische Objekt nach
Durchführung der Bewegung in dieser Endposition verbleibt.
Der entwickelte Algorithmus orientiert sich an der entkoppelten Trajektori-
enplanung aus Abschnitt 2.4.6. Der Hauptunterschied ist die Verwendung
einer Menge von homotopen Pfaden, für die gleichzeitig Zustandstrajektori-
en berechnet werden, aus denen die schnellste ausgewählt wird. Folgende
Verfahrensschritte werden durchgeführt:
1) Verwende einen einfachen Planungsalgorithmus zur Bestimmung eines
stückweise linearen Pfades τ : [0,1]→ C mit den Wegpunkten p0, . . . , pn.
2) Transformiere τ durch eine Pfadglättung in einen neuen Pfad τ′, der die
differenziellen Zwangsbedingungen besser erfüllt.
3) Erzeuge eine Menge von homotopen geglätteten Pfaden auf Basis von τ′.
4) Berechne für jeden homotopen Pfad τ′i eine Zeitsteuerungsfunktion
σi : [0, tF]→ [0,1] für τ′i , so dass τ′i ◦ σi einen zeitparametrisierten Pfad
durch C bilden. Dieser Pfad muss den Anforderungen an eine Zu-
standstrajektorie z̃i mit z̃i(t) ∈ Z f ree(t) genügen und ż = F(z(t),u(t))
sowie u(t) ∈U(z(t)) für alle Zeitpunkte erfüllen, bis die terminierende
Aktion uT zum Endzeitpunkt tiF ausgeführt wird.
5) Wähle den Pfad τ′i aus, dessen Endzeitpunkt t
i
F am kleinsten ist.
6) Entwerfe eine Regeleinrichtung π :Z →U, die den Verlauf der geplanten
Zustandstrajektorie z̃i in der physischen Realität mit möglichst geringem
Fehler nachzubilden versucht.
5.2 Bestandteile und Ablauf des Verfahrens 107
Abbildung 5.4 illustriert das Verfahren. Es ist zu beachten, dass die Schritte 1
und 6 Teil des Verfahrens sind, aber nicht Teil des entwickelten Algorithmus.
Der Algorithmus akzeptiert als Eingabe eine Wegpunktliste und berechnet in
den Schritten 2 bis 5 eine kollisionsfreie, zeitoptimale Trajektorie zur Ausfüh-
rung in einer Regeleinrichtung (z. B. in einem Transportroboter). Der Entwurf
der Regeleinrichtung ist Bestandteil der empirischen Evaluation, während
die Erstellung der Wegpunktliste im Rahmen der simulativen Evaluation
betrachtet wird.
Durchführbarkeit
Die Durchführbarkeit des Verfahrens wird durch die spezifische Gestaltung
des idealen logistischen Raums mit seinen sicheren Quellen und Senken und
durch Verfahrensschritt 4 garantiert. Die Bestimmung der Zeitsteuerungs-
funktion wird durch eine pfadbeschränkte Trajektorienplanung vorgenommen,
die in Abschnitt 2.4.6 beschrieben wird und für die es zahlreiche effizien-
te Methoden gibt. Der Algorithmus verwendet die sogenannte Bang-Bang-
Methode zur zeitoptimalen Bestimmung eines Geschwindigkeitsprofils unter
Berücksichtigung der dynamischen Hindernisregion Zobs. Eine detaillierte
Betrachtung der garantierten Terminiertheit des Algorithmus findet sich in
Abschnitt 5.6. Intuitiv lässt sich die Durchführbarkeit verstehen, wenn man
den schlechtesten Fall der Bewegungsplanung betrachtet, bei dem ein Ob-
jekt an seiner Quelle auf alle anderen Objekte warten muss, die eine höhere
Priorität besitzen. Da diese Objekte garantiert den Raum nach Abschluss des
Bewegungsvorgangs an den Senken verlassen, kann die Bewegungsplanung
immer durchgeführt werden, nachdem der Raum vollständig leer ist.
Heuristisches Verhalten
Das Ziel der heuristischen Bestandteile des Verfahrens ist die Steigerung der
Leistung in Bezug auf die Anzahl von Quelle-Ziel-Bewegungen über die Zeit.
Dazu wird angenommen, dass in Verfahrensschritt 1 ein möglichst kurzer
Pfad von Quelle zu Ziel gewählt wird. Die Pfadglättung in Verfahrensschritt
2 vermeidet kinodynamisch ungünstige Trajektorien und unterstützt so die
Verwendung von hohen Geschwindigkeiten und Beschleunigungen. Dies führt
zu einer geringen Aufenthaltszeit im logistischen Raum und minimiert die
Hindernisregion Zobs für nachfolgende Planungsprozesse. In der Folge wer-
den für diese Prozesse Trajektorien mit hohen Geschwindigkeiten möglich,
sodass sich ein kontinuierlich vorteilhaftes Gesamtverhalten ergibt.
Abbildung 5.5 veranschaulicht die in Verfahrensschritt 3 vorgenommene
Erzeugung homotoper Pfade im idealen logistischen Raum. Grundlage die-
ser Heuristik ist die Überlegung, dass im freien Raum eine Vielzahl von
kinodynamisch günstigen Pfaden existieren kann, sodass sich die Wahr-
scheinlichkeit erhöht, dass einer dieser Pfade kollisionsfrei bzw. mit wenigen
Kollisionen geplant werden kann. Dies minimiert notwendige Bremsmanö-
108 5 Verfahren zur kinodynamischen Bewegungsplanung
Idealer logistischer Raum
1) Stückweise linearer Pfad
- Liste mit Wegpunkten von Start zu Ziel
- manuell festgelegt oder Ergebnis eines 
Suchverfahrens
2) Geglätteter Pfad
- Vermeidung kinodynamisch ungünstiger 
Trajektorien
3) Menge homotoper Pfade
- heuristische Kollisionsvermeidung
4a) Trajektorie mit Geschwindigkeitsprofil
- zeitoptimale Bewegung unter kinodynamischen 
Zwangsbedingungen
4b) Angepasstes Geschwindigkeitsprofil
- sichere Vermeidung von Kollisionen mit 
existierenden Trajektorien anderer Objekte
5) Zeitoptimale Trajektorie
- kollisionsfrei in Bezug auf alle vorher existierenden 
Trajektorien
6) Regeleinrichtung
- Ausführung der Bewegung in der physischen Welt
Physischer Raum
Abb. 5.4 Bestandteile des Verfahrens
ver bei der pfadbeschränkten Trajektorienplanung und führt in der Folge zu
höheren Geschwindigkeiten mit den oben genannten günstigen Auswirkun-
gen auf die Leistungsfähigkeit.
5.2 Bestandteile und Ablauf des Verfahrens 109
q s‘
q‘
s
Abb. 5.5 Homotope Pfade im idealen logistischen Raum
Dezentralisierbarkeit
Die Dezentralisierbarkeit des Verfahrens unterscheidet sich in Bezug auf die
Durchführung des Planungsprozesses und die Ausführung der physischen
Bewegung. Für eine dezentrale Planung sind zwei Faktoren von besonderer
Bedeutung:
• Konsens über Prioritäten
Die kritische Eigenschaft für eine dezentrale Koordination der Planungs-
prozesse ist die Priorität, mit der die dynamische Hindernisregion be-
stimmt wird. Dazu ist es notwendig, eine globale Ordnung zu schaffen,
die durch die zentrale Prozessliste in Abbildung 5.3 dargestellt ist.
• Austausch existierender Pläne
Für eine verteilte Berechnung müssen den Objekten mit niedriger Priori-
tät alle Pläne von Objekten mit höherer Priorität zur Verfügung gestellt
werden, sodass die dynamische Hindernisregion abgeleitet werden kann.
Sobald ein Planungsprozess alle Pläne höher priorisierter Objekte erhalten
hat, kann er autonom seine Planung durchführen. Ein effizienter Austausch
der Pläne ist von einer effizienten Repräsentation jedes geplanten Pfads τ′
und seiner Zeitsteuerungsfunktion σ abhängig. Aus beiden kann die Zu-
standstrajektorie z̃ abgeleitet werden, die Teil der Hindernisregion wird.
Dies wird in diesem Verfahren im Wesentlichen durch die Verwendung von
Splines erreicht, die in Abschnitt 5.3 beschrieben werden.
Eine anschließende dezentrale Ausführung der geplanten Bewegung ist
durch die vollständige und kollisionsfreie Planung der Trajektorien von Quel-
le zu Senke einfach umzusetzen. Das bewegte Objekt braucht ausschließlich
seine eigene Zustandstrajektorie zu kennen, um autonom die physische Be-
wegung ausführen zu können, da das Verfahren keine Umplanung erfordert
110 5 Verfahren zur kinodynamischen Bewegungsplanung
und neu hinzukommende Objekte die Bewegungen existierender Objekte
berücksichtigen. Sobald das Objekt seine Zustandstrajektorie z̃ kennt, sind
die folgenden zwei Eigenschaften für die Regeleinrichtung von Bedeutung:
• Kontinuierliche Lokalisierung einzelner Teilnehmer
Ein bewegtes Objekt verfügt über die Fähigkeit, sich kontinuierlich zu
lokalisieren, sodass Abweichungen von der geplanten Trajektorie recht-
zeitig erkannt werden können.
• Globale Zeitbasis
Für eine dezentrale und autonome Ausführung der Bewegungen müssen
alle Teilnehmer eine globale Zeitbasis teilen, die sicherstellt, dass die
geplanten Bewegungen zum richtigen Zeitpunkt durchgeführt werden.
Eine Betrachtung der Dezentralisierbarkeit ist Teil der empirischen Evaluati-
on.
Echtzeitfähigkeit
Für die Bestimmung der Echtzeitfähigkeit wird betrachtet, ob das Verfahren
bei Eintritt eines neuen Objekts in eine Quelle die Zeit des Erreichens der
gewünschten Senke im Voraus bestimmen kann. Da ein fertiggestellter Bewe-
gungsplan über die Zeitsteuerungsfunktion σ den Zeitpunkt des Erreichens
der Senke bereits enthält, konzentriert sich die Bestimmung der Echtzeitfä-
higkeit auf die Fragestellung, ob das Verfahren die Berechnung eines Plans
rechtzeitig vor Beginn der physischen Bewegung abschließen kann.
Die Laufzeit des Verfahrens hängt insbesondere von der Bestimmung
der Geschwindigkeitsprofile unter Berücksichtigung der Hindernisregion in
Verfahrensschritt 4 ab. Eine detaillierte Betrachtung des Laufzeitverhaltens
findet sich in Abschnitt 5.6. Es kann gezeigt werden, dass die algorithmi-
sche Komplexität von Verfahrensschritt 4 nicht wesentlich schneller als eine
lineare Funktion bezüglich der Eingabegrößen n (Anzahl diskreter Betrach-
tungspunkte auf dem geglätteten Pfad) und m (Anzahl bereits existierender
Pfade mit höherer Priorität) wächst (in O-Notation O( n m )). In der Praxis
zeigt sich, dass die Berechnung in sehr kurzer Zeit möglich ist. Eine Echtzeit-
fähigkeit des Verfahrens ist gegeben, wenn die Anzahl von gleichzeitigen
Bewegungsprozessen auf einen festen Maximalwert mmax begrenzt wird und
die Länge möglicher Pfade im Raum auf einen Maximalwert nmax beschränkt
wird. Anschließend kann ein fester Wert für die Worst-Case-Laufzeit des Ver-
fahrens in Bezug auf einen spezifischen logistischen Raum berechnet werden.
Dies ermöglicht eine Echtzeitfähigkeit des Gesamtverfahrens.
Im Fall der dezentralisierten Bestimmung der Bewegungspläne muss
beachtet werden, dass die Zeiten für die Bestimmmung der Priorität und für
die Übertragung der Trajektorien mit höherer Priorität Teil der Worst-Case-
Laufzeit sind und somit die Echtzeitfähigkeit beeinflussen.
5.3 Splinebasierte Trajektorien 111
Bewertungsrahmen zur empirischen Evaluation
Die Bewertung des Verfahrens im Rahmen der empirischen Evaluation geht
auf die Fragestellung ein, ob ein Transportroboter konstruiert werden kann,
der die geplanten Trajektorien als physische Bewegung in der realen Welt
umsetzen kann (Verfahrensschritt 6). Insbesondere stellt sich die Frage, mit
welcher Geschwindigkeit und Beschleunigung in der Praxis gefahren werden
kann. Eine weitere Fragestellung ist die Genauigkeit, mit der die Regelein-
richtung die Zustandstrajektorie in der Realität abbilden kann, was sich auf
den notwendigen Sicherheitsabstand auswirkt, der bei der Planung berück-
sichtigt werden muss.
Bewertungsrahmen zur simulativen Evaluation
Die simulative Evaluation baut auf den Ergebnissen der empirischen Eva-
luation auf. Das Ziel ist die Bestimmung der Leistungsfähigkeit eines Lo-
gistiksystems, das durch das Verfahren gesteuert wird. Die Bewertung der
Leistungsfähigkeit findet im Rahmen der Problemstellung eines Paketsor-
tiersystems statt, das durch das Konzept des idealen logistischen Raums
beschrieben werden kann. Die zentrale Fragestellung ist, ob das Verfahren
für die Bewegungsplanung eines Transportroboterschwarms die Leistungsfä-
higkeit eines existierenden Sortiersystems erreicht.
5.3 Splinebasierte Trajektorien
Für das Verfahrenwerden Splines als Mittel verwendet, um den genauenWeg
durch den logistischen Raum für ein Objekt zu bestimmen. Die eigentliche
Trajektorie, die eine exakte Geschwindigkeit und Beschleunigung an jedem
einzelnen Punkt des Weges bestimmt, besteht dann aus diesem Weg und
einem separat erstellten Geschwindigkeitsprofil, wodurch eine Darstellung
der geplanten Bewegung über Raum und Zeit entsteht.
Für das Verfahren werden Splines als segmentweise polynomiale para-
metrische Kurven in der zweidimensionalen Ebene Q(t) ∈R2 angenommen.
Alle Segmente des Splines sind Polynome n-ten Grades. Ein wesentlicher
Aspekt von Splines ist die Erfüllung bestimmter Stetigkeitsbedingungen
(siehe z. B. [Hug+13], S. 480).
Parametrische Stetigkeit
Eine parametrische Kurve ist parametrisch stetig im n-ten Grad für den Pa-
n
rameter t, wenn die n-te Ableitung ddtnQ(t) stetig ist. Sie wird dann auch
Cn-stetig genannt.
Geometrische Stetigkeit
Eine parametrische Kurve gilt als im n-ten Grade geometrisch stetig, wenn
n
die Vektoren der linken und rechten Grenzwerte der n-ten Ableitung ddtnQ(t)
112 5 Verfahren zur kinodynamischen Bewegungsplanung
in ihrer Richtung übereinstimmen, daher müssen sie skalare Vielfache von-
einander sein.
Für Punkte auf einem Polynom sind diese Stetigkeitsbedingungen immer
erfüllt, da Ableitungen beliebigen Grades stetig sind. Daher sind die Verbin-
dungspunkte der Polynomsegmente kritisch für die Erfüllung der Stetigkeits-
bedingung der Kurve. Im Allgemeinen ist die geometrische Stetigkeit eine
Folge der parametrischen Stetigkeit gleichen Grades, es sei denn, die jeweili-
ge Ableitung ergibt den Nullvektor. Dann können Situationen entstehen, in
denen der Vektor des linken Grenzwerts in eine andere Richtung zeigt als der
des rechten Grenzwerts, obwohl beide am Verbindungpunkt den Nullvektor
ergeben.
Erwünschte Eigenschaften
Damit ein bewegtes Objekt in der Lage ist, einer splinebasierten Bahnkurve
zu folgen, und die Bahn effizient geplant werden kann, ist es hilfreich, wenn
die Splines mehrere Eigenschaften aufweisen, die im Folgenden diskutiert
werden.
Für das hier entwickelte Verfahren wird von einem holonomischen Be-
wegungsmodell der bewegten Objekte ausgegangen: Die steuerbaren Frei-
heitsgrade entsprechen genau den Freiheitgraden des logistischen Raums.
Daher haben nicht alle Eigenschaften, die Splines bieten können, in dieser
Arbeit die Bedeutung, die sie hätten, wenn es sich um nichtholonomische
bewegte Objekte handeln würde. Die folgenden Ausführungen zeigen aber
die Möglichkeiten von Splines auf, die sie insbesondere im Gegensatz zu git-
terbasierten Bewegungsverfahren besitzen. Dabei sollen Eigenschaften, die
eine Fahrbarkeit der Spline grundsätzlich beeinflussen, betrachtet werden, da
sie sich auch auf die Geschwindigkeit auswirken, mit der gefahren werden
kann. Es handelt sich in den meisten Fällen um Stetigkeitseigenschaften.
Stetigkeit im Richtungswinkel
Zusätzlich zur selbstverständlich gegebenen C0-Stetigkeit in der Position
kann es sinvoll sein, dass die Bahnkurve G1- oder C1-stetig ist. Dies hat zur
Folge, dass sich der Richtungswinkel des bewegten Objekts ändert. Diese
Eigenschaft ist insbesondere dann erforderlich, wenn er sich nicht auf der
Stelle drehen kann (z. B. bei einem autoähnlichen Fahrzeugmodell).
Stetigkeit in der Krümmung
Eine exakte Befahrung von Splines mit unstetiger Krümmung würde bei
gleichbleibender Geschwindigkeit sehr hohe, im schlimmsten Fall unendlich
hohe Beschleunigungen erfordern. Sprünge im Krümmungsverlauf bedeuten
starke, abrupte Kräfte auf das bewegte Objekt und seine eventuelle Nutzlast,
die zu Schäden führen können. Eine ineffiziente Lösung ist die Reduzierung
5.3 Splinebasierte Trajektorien 113
der Geschwindigkeit bis hin zum Stillstand. Ein stetiger Krümmungsverlauf
ist also in mehrfacher Hinsicht vorteilhaft. Für die Betrachtung der Auswahl
einer geeigneten Spline-Familie soll auf die folgende Definition zurückgegrif-
fen werden. Die Krümmung κ ist der Kehrwert des Radius einer Kurve und
in [Ste15] wie folgt beschrieben: ∣∣
κ = ∣∣dT ∣∣∣∣ ,ds
wobei T die Funktion des Tangentenvektors der Kurve und s die Bogenlänge
der Kurve ist. Die allgemeine Formel kann man mithilfe des Kreuzprodukts
folgendermaßen ausdrücken:
Q′(t)×Q′′(t)
κ(t) =
|Q′(t)|3
. (5.1)
Wie aus der allgemeinen Form der Gleichung zu erkennen ist, kann über
die Steuerung der ersten und zweiten Ableitung der Kurve eine Steuerung
der Krümmung erreicht werden. Die Wahl einer geeigneten Splinefunktion,
die stetig in ihrer ersten und zweiten Ableitung ist (C2-Stetigkeit), impliziert
damit auch eine Stetigkeit in der Krümmung.
Festlegung der ersten und zweiten Ableitung beim Start
Um eine Trajektorie, die bereits ausgeführt wird, reibungslos verändern
zu können, ist die Fähigkeit zur Erzeugung von splinebasierten Kurven
notwendig, die am Startpunkt mit vorher festgelegten Werten für Geschwin-
digkeitsvektor und Beschleunigungvektor umgehen können. Auf dieseWeise
kann die Bahnkurve eines sich bereits bewegenden Objekts nahtlos verändert
werden. Zusätzlich zu den Eigenschaften, die sich günstig auf das Fahrver-
halten bzw. die Fahrbarkeit auswirken, werden Eigenschaften benötigt, die
sich auf die Planbarkeit der splinebasierten Bahnkurve auswirken.
Lokalität
Als Lokalität wird die Eigenschaft bezeichnet, die wichtig wird, wenn ein ein-
zelnes Segment eines Multisegmentsplines geändert werden soll. Ein Spline
besitzt Lokalität, wenn Änderungen an einem einzelnen Segment des Splines
nur eine begrenzte Nachbarschaft dieses speziellen Segments betreffen und
nicht zu Änderungen für alle Segmente des Splines führen. Mithilfe dieser
Eigenschaft entsteht die Möglichkeit, die Form eines Splines lokal zu manipu-
lieren (z. B. um ein Hindernis zu umgehen), ohne dass die globale Form des
Splines neu berechnet werden muss. Diese Eigenschaft kann auch zu einer
effizienten Neuberechnung führen: Ein großer Teil der Parameter des Splines
wird nach einer lokalen Änderung gleich bleiben, sodass man erwarten kann,
dass die Berechnung für die Aktualisierung weniger aufwändig ist als für
114 5 Verfahren zur kinodynamischen Bewegungsplanung
eine globale Änderung der Form des Splines.
Korrelation von Form und Parametern
Das Ausmaß, in dem die Parameter eines Splines auf einer intuitiven Ebene
mit seiner Form übereinstimmen, beeinflusst die Nutzbarkeit eines Splines
bei der Planung. Wenn eine Trajektorie durch eine Umgebung geführt wer-
den soll, ergibt sich die Aufgabe, einen Spline zu definieren, der bestimmte
Punkte durchläuft und bestimmte Bereiche meidet. Diese Aufgabe wird sehr
erleichtert, wenn es relativ direkte Zusammenhänge zwischen der Form des
Splines und seinen Parametern gibt.
Komplexität in der Berechnung
Wenn die Berechnung der Splines in kurzer Zeit oder auf einem System mit
eng begrenzter Rechenleistung erfolgen muss, dann spielt der Berechnungs-
aufwand eine gewichtige Rolle in der Anwendung. Dies kann in Fällen wich-
tig werden, wenn der Start des Bewegungsvorgangs durch die Berechnung
verzögert wird und damit andere Bewegungsvorgänge blockiert. Zusätzlich
ist eine komplexe Spline-Implementierung im Rahmen dieser Arbeit nicht
zielführend, da nicht Kernbestandteil des Verfahrens der Kollisionsvermei-
dung.
Auswahl einer Spline-Familie
Eine Einführung in bekannte Splines und eine detaillierte Untersuchung
bestimmter Familien finden sich in [Spr08]. Zusammengefasst wird die Dis-
kussion in Tabelle 5.1, in der die wichtigsten Eigenschaften der vorgestell-
ten Spline-Familien aufgeführt sind. Hermite-Splines und kubische Bézier-
Splines sind auf einer segmentweisen Basis definiert. Um diese Splines zu er-
zeugen, die aus mehreren Einzelsegmenten (mehreren Polynomen) bestehen,
ist sogenanntes Stitching erforderlich. Dabei werden manuell zwei Splineseg-
mente so zusammengesetzt, dass die Übergänge den jeweiligen Stetigkeits-
bedingungen entsprechen. Im Gegensatz dazu sind Catmull-Rom-Splines
und B-Splines so definiert, dass der Stitching-Prozess bereits enthalten ist.
Diese bislang genannten Spline-Familien gehören zu den kubischen Splines
und werden in vielen Anwendungen genutzt (z. B. in der Computergra-
fik). In [Spr08] wird gezeigt, dass kubische Splines zu wenig Freiheitsgrade
besitzen, um alle Eigenschaften erfüllen zu können. Die Schlussfolgerung
ist, dass auf Splines mit höherer Ordnung zurückgegriffen werden muss,
und es wird der Einsatz von Quintischen Bézierkurven vorgeschlagen. Diese
können alle Eigenschaften bezüglich der Fahrbarkeit und Planbarkeit erfül-
len, sind jedoch mathematisch deutlich komplexer in der Handhabung und
berechnungsintensiv.
In diesem Zuge soll erwähnt werden, das B-Splines zwar C2-Stetigkeit auf-
weisen, aber dafür keine starke und intuitive Korrelation zwische Form und
5.3 Splinebasierte Trajektorien 115
Kontrollpunkten, die wiederum bei kubischen Bézierkurven und Catmull-
Rom-Splines gegeben ist. Man kann durch Aufgabe der Lokalität während
des Stitching-Prozesses kubische Bézierkurven und Hermite-Splines so zu-
sammenfügen, dass eine C2-Stetigkeit gegeben ist. Die resultierenden Splines
werden allerdings hochgradig instabil und reagieren auf einzelne Paramete-
ränderungen mit einem stark oszillativen Verhalten (vgl. [Spr08]).
Tabelle 5.1 Spline-Familien und ihre Eigenschaften
Kubisch Quintisch
Eigenschaft Hermite Bézier Catmull-Rom B-Spline Bézier
Automatisches Stitching - - X X -
C1-Stetigkeit X X X X X
C2-Stetigkeit - - - X X
Verlauf durch Kontrollpunkte X X X - X
Starke Korrelation - X X - X
Lokalität X X X X X
Einfache Berechnung X X X X -
Wie in Tabelle 5.1 zu sehen ist, gibt es keine Spline-Familie, die alle erwünsch-
ten Eigenschaften bereitstellen kann. Jedoch sind einige Eigenschaften in
Bezug auf das zu entwickelnde Verfahren besonders hilfreich:
• Automatisches Stitching Da die übergeordnete Wegeplanung als Er-
gebnis eine Wegpunktliste liefert, kann bei automatischem Stitching
die Splinefunktion diese Liste als Kontrollpunkte übernommen werden,
ohne dass ein weiterer Arbeitsschritt bei der Zusammenführung von
Segmenten notwendig ist.
• C1-StetigkeitDieC1-Stetigkeit ermöglicht eine kontinuierliche Geschwin-
digkeitsänderung durch eine nicht-abrupte, weiche Bahnkurve. Alle hier
betrachteten Spline-Familien können so angewendet werden, dass sie
diese Eigenschaft besitzen. Dies bildet den Hauptunterschied zu allen
gitterbasierten Bewegungsverfahren, die Richtungsänderungen nur im
rechten Winkel fahren können und daher an Kreuzungspunkten vollstän-
dig stoppen müssen.
• Verlauf durch Kontrollpunkte, starke Korrelation, Lokalität Ein Kern-
bestandteil des in dieser Arbeit entwickelten Verfahrens besteht darin,
eine Vielzahl zueinander homotoper Bahnkurven für eine Quelle-Ziel-
Relation zu erzeugen. Alle Eigenschaften, die eine solche Erzeugung
und Veränderung von Splines unterstützen, sind in diesem Fall sehr
vorteilhaft.
• Einfache Berechnung Für die Validierung des Verfahrens wird im späte-
ren Verlauf der Arbeit die Simulation von einer großen Zahl an bewegten
Objekten durchgeführt. In Kombination mit der Erzeugung von homoto-
pen Varianten pro Objekt und einer Laufzeit, die anwendungsbedingt,
116 5 Verfahren zur kinodynamischen Bewegungsplanung
mehrere Stunden erfordert (z. B. Schichtbetrieb im Logistikzentrum),
ergibt sich, dass eine einfache Berechnung der einzelnen Splines einen
großen Laufzeitvorteil in der Validierung ermöglicht. Dieser Vorteil kann
natürlich grundsätzlich auch in der Praxis relevant werden, wenn sehr
große Systeme gesteuert werden sollen.
Zur Bedeutung der C2-Stetigkeit lässt sich bemerken, dass sie in der Theoe-
rie äußerst wichtig erscheint, da abrupte Beschleunigungsänderungen sich
ungünstig auf die Fahrbarkeit auswirken können. In der Praxis hat sich
gezeigt, dass im Fall des entwickelten Loadrunners die Fahrbarkeit gege-
ben war. Für den dauerhaften Betrieb ist daher eine C2-Stetigkeit sicherlich
wünschenswert. Für die Verfahrensentwicklung in dieser Arbeit hingegen
kann diese Eigenschaft vernachlässigt werden. Dies ist insbesondere dadurch
ermöglicht, dass ein späterer Umstieg auf eine geeignetere, aber schwieriger
handhabbare Spline-Familie problemlos möglich ist.
Da im hier entwickelten Verfahren keine Splines während der Fahrt verän-
dert werden, haben die Eigenschaften der freien Wählbarkeit von Parameter
beim Start der Splines in diesem Fall keine Bedeutung.
Nach diesen Betrachtungen sind, wie auch gut in Tabelle 5.1 zu sehen ist,
für die Verfahrensentwicklung in dieser Arbeit Catmull-Rom-Splines den
anderen Familien vorzuziehen.
Catmull-Rom-Splines
Ein Catmull-Rom-Spline ist durch eine Folge von Kontrollpunkten P1, ...,Pm
definiert2. Er führt durch die Kontrollpunkte P1, ...,Pm−1 und der Tangen-
tenvektor im Punkt Pi ist parallel zum Vektor Pi−1Pi+1 (vgl. [CR74]). Ein
Catmull-Rom-Spline setzt sich aus Segmenten kubischer Polynome zusam-
men, die sich Kontrollpunkte teilen, um eine C1-Stetigkeit zu erreichen. Das
Segment Si(t) verbindet die Kontrollpunkte Pi−2 und Pi−1 über Si(0) = Pi−2
und Si(1) = Pi−1. Zusätzlich werden für die Bestimmung der Tangenten-
vektoren an Pi−2 und Pi−1 jeweils die Punkte Pi−3 und Pi herangezogen.
Dies bedeutet, dass der erste und der letzte Kontrollpunkt eines Catmull-
Rom-Splines nicht mit der Bahnkurve verbunden sind, sondern nur die
Tangentenvektoren am Anfangs- und Endpunkt (mit-)bestimmen.
Die formale Definition für einen Catmull-Rom-Spline mit den Kontrollpunk-
ten P0, ...,Pm und m > 3 ergibt sich über die Bestimmung der einzelnen Seg-
mente. Das i-te Segment mit i ∈ [3,m] ist durch
2 Im Rahmen dieser Arbeit wird von einem zweidimesionalen Weltmodell ausgegangen,
so dass ein Punkt P(x,y)mit x,y ∈R2 definiert ist.
5.3 Splinebasierte Trajektorien 117
P P31
P
P 20
Abb. 5.6 Beispiel eines Catmull-Rom-Splines
S (t) = T ·M · Gii
  −1 3 −3 1 Pi−33 2 1  2 −5 4 −1= ( t t t 1 ) 2 −1 0 1 0Pi−2 (5.2)Pi−1
0 2 0 0 Pi
gegeben. Der Vektor mit dem Basisspline kann als −t3 + 2t2 − t1 3t3 − 5t2 + 2
B = M · Gi = 
2  −3t3 + 4t2 + t
t3 − t2
abgeleitet werden. Und über dieBerechnung der Koeffizienzm 
atrix
−Pi−3 + 3Pi−2 − 3Pi−1 + Pi
1 2P − 5P + 4P − P
Ci = M · Gi =  i−3 i−2 i−1 i2 −Pi−3 + + Pi−1 
2Pi−2
kann die Gleichung 5.2 als Polynom
1
Si(t) = (−Pi−3 + 3Pi−2 − 3Pi−1 + Pi) t32
1
+ (2Pi−3 − 5P 32 i−2 + 4Pi−1 − Pi) t
1
+ (−P
2 i−3
+ Pi−1)t+ Pi−2
118 5 Verfahren zur kinodynamischen Bewegungsplanung
dargestellt werden. Nun lassen sich durch Einsetzen von 0 für den Beginn
und 1 für das Ende die Start- und Endpunkte des Splines bestimmen. Durch
Si(0) = Pi−2 Si(1) = Pi−1 (5.3)
1 1
S′i(0) = (Pi−1 − Pi−3) S′i(1) = (Pi − P2 2 i−2) (5.4)
wird die C1-Stetigkeit gezeigt, da S ′ ′i−1(1) = Si(0) und Si−1(1) = Si0. Des
Weiteren kann erkannt werden, dass die Tangente in Pi parallel zum Vektor
Pi−1Pi+1 liegt.
Die Kontrollpunkte am Anfang und Ende des Splines können dazu ver-
wendet werden, die existierende Ausrichtung eines nicht-holonomischen
Fahrzeugs anzugeben, sodass dieses eine tatsächlich fahrbare Bahnkurve
erhält. In diesem Zusammenhang soll bemerkt werden, dass bei einem holo-
nomisch bewegbaren Objekt, wie es in diesem Verfahren zugrunde gelegt
wird, die Definition des Splines noch weiter vereinfacht werden kann. Über
P0 = −d(P2 − P1) (5.5)
Pm = d(Pm−1 − Pm−2) (5.6)
mit d > 0 und d ∈ R werden die Tangentenvektoren in P1 und Pm−1, dem
Startpunkt und dem Endpunkt der Bahnkurve, in Richtung des nächsten
bzw. aus der Richtung des vorherigen Kontrollpunkts gesetzt. Dies ist für
ein holonomisch bewegtes Objekt ein gültiges Verhalten, da dieses aus dem
Ruhezustand in jede beliebige Richtung anfahren kann. Auf diese Weise
kann eine einfache Wegpunktliste W0, ...,Wn mit n > 0 übergeben werden,
und es entsteht ohne weitere Schritte eine holonomisch fahrbare Bahnkurve
mit der erwünschten C1-Stetigkeit. Diese unkomplizierte Handhabbarkeit
vereinfacht Test und Validierung des in der Arbeit entwickelten Verfahrens.
Für die Berechnung von Punkten auf einem einzelnen Segment eines
Catmull-Rom-Splines wird das rekursive Verfahren von Barry und Goldman
verwendet (vgl. [BG88]). Es führt neben den vier Kontrollpunkten P0,P1,P2,P3
zusätzlich vier sogenannte Knotenpunkte t0, t1, t2, t3 ein, die zur Bestimmung
des Splines verwende[t√werden. Für Pi ∈Knotenpunkte]sind durchα
t 2i+1 = (xPi 1 − xPi ) + (y+ Pi+1 − yP 2i ) + ti (5.7)
mit t0 = 0 definiert. Mit dem Parameter α lässt sich die Form der Splines
unabhängig von den Kontrollpunkten beeinflussen. Für α = 0,5 wurde nach-
gewiesen, dass der Spline keine ungewünschten Eigenschaften wie Spitzen
oder Überschneidungen erzeugt (vgl. [YSK09]).
5.4 Numerisches Geschwindigkeitsprofil 119
(a) (b) (c)
Abb. 5.7 Unterschiedliche Parametrisierung eines Catmull-Rom-Splines mit (a) α = 0, (b)
α = 0,5 und (c) α = 1
Algorithmus 1 Bestimmung eines Punktes auf einem zentripetalen Catmull-
Rom-Splinesegment nach Barry und Goldman
Eingabe: Zeitpunkt t ∈R+ und Kontrollpunkte P0,P1,P2,P3 mit P(x,y) und x,y ∈R2
Ausgabe: Punkt auf der Spline P
1: α← 12
2:
3: t0← 0[√ ]α
4: t ← [√(xP − xP )21 1 0 + (yP − yP )21 0 ] + t0α
5: t2← [√(xP − xP )22 1 + (yP − yP )22 1 ] + t1α
6: t3← (xP 2 23 − xP2 ) + (yP3 − yP2 ) + t2
7:
8: t← (t2 − t1) · t
9:
10: A1← P t1−t + P t−t00 t1−t0 1 t1−t0
11: A ← P t2−t + P t−t12 1 t2−t1 2 t2−t1
12: A t3−t t−t23← P2 t −t + P3 2 3 t3−t2
13:
14: B t2−t1← A1 t −t + A
t−t0
2 0 2 t2−t0
15: B ← A t3−t2 2 t −t + A
t−t1
3 1 3 t3−t1
16:
17: P← B t2−t t−t11 t2−t + B1 2 t2−t1
18:
19: return P
5.4 Numerisches Geschwindigkeitsprofil
Wie zu Beginn des Kapitels dargestellt, wird die Ausführung der physischen
Bewegung durch die Regelung der Aktoren von der Planung der Trajektorie
getrennt durchgeführt. An der Schnittstelle liegt ein Zustandsregler, dem für
eine präzise Regelung zusätzlich zur Bahnkurve auch ein Geschwindigkeits-
120 5 Verfahren zur kinodynamischen Bewegungsplanung
profil zur Verfügung gestellt wird, sodass die zu erreichenden Zielparameter
für Position, Geschwindigkeit und Beschleunigung an jedem Punkt der Tra-
jektorie feststehen.
Ein intuitiver Ansatz wäre es, für die Erstellung des Geschwindigkeitspro-
fils auf die erste und zweite Ableitung des Splines zurückzugreifen, um die
Geschwindigkeits- und Beschleunigungswerte zu bestimmen. Dazu wird der
Spline zu einer Funktion über die Zeit umparametriert, wie z. B. durch eine
lineare Abbildung der Zeit auf den internen Splineparameter t. Dieser Ansatz
hat den Nachteil, dass sich jegliche Änderung am Geschwindigkeitsprofil
über diesen Parameter auf die gesamte Bahnkurve auswirkt. Wenn also zur
Erfüllung der kinodynamischen Randbedingungen an einer einzelnen Stelle
der Bahnkurve (z. B. an einer scharfen Kurve) die Beschleunigung begrenzt
werden muss, führt die Änderung des Splineparameters dazu, dass die ge-
samte Trajektorie langsamer durchfahren wird. Dieser Nachteil wirkt sich in
einer Umgebung mit vielen sich bewegenden Objekten noch gravierender
aus, da eine Änderung der Geschwindigkeiten auf der gesamten Länge der
Bahnkurve zu neuen Kollisionen führen kann. Eine alternative Methode, die
diese Anpassungen auf die unmittelbare Umgebung der betroffenen Stelle
beschränkt, also die Forderung nach Lokalität, ist daher wünschenswert.
Struktur des Geschwindigkeitsprofils
Die im Folgenden beschriebene Methode orientiert sich im Wesentlichen
im Vorgehen nach [Spr08] und ist nicht nur auf Catmull-Rom-Splines be-
schränkt, sondern kann auf jede parametrische Kurve oder gitterbasierte,
rechtwinklige Pfade angewendet werden. Dieser Umstand ist in doppelter
Hinsicht von Vorteil. Das Verfahren kann zum einen zur Berechnung der
Bahnkurve modular ausgetauscht werden und ist weniger abhängig von der
genauen Implementierung. Zum anderen lässt sich durch die gute Vergleich-
barkeit eine Validierung des neuen Verfahrens gegenüber gitterbasierten
Kollisionsvermeidungsstrategien durchführen.
Ein Geschwindigkeitsprofil besteht aus den Planungspunkten pi = Q(ui),
die entlang der Bahnkurve Q(u) verteilt sind und denen translationale Ge-
schwindigkeitswerte vi zugeordnet werden. Die Planungspunkte werden
idealerweise äquidistant in Bezug auf die Kurvenlänge verteilt, sodass zwei
benachbarte Planungspunkte pi, pi+1 ein Intervall auf der Bahnkurve mit
der Länge ∆s beschreiben. Für eine exakte Berechnung von s bedarf es einer
numerischen Integration für die Bestimmung der Länge des Splines.
Zwischen diesen Planungspunkten bewegt sich das Objekt mit einer an-
genommenen konstanten positiven oder negativen Beschleunigung. Diese
Annahme ermöglicht eine Bestimmung der Zeit, die das Objekt für die Bewe-
gung im Intervall von Punkt pi zu Punkt pi+1 benötigt. Sobald die Start- und
Zielgeschwindigkeiten vi und vi+1 festliegen, können die Ankunftszeiten ti
5.4 Numerisches Geschwindigkeitsprofil 121
und ti+1 bestimmt werden. Bei n Planungspunkten wird mit der Zeit tn auch
direkt die gesamte Durchlaufzeit des Objekts über die Bahnkurve bestimmt.
Algorithmus 2 Bestimmung der Planungspunkte und Erzeugung der Daten-
struktur
Eingabe: Sequenz der Kontrollpunkte c[], Abstand zwischen den Planungspunkten ∆s
Ausgabe: Sequenz von Planungspunkten p[]
1: pointsTotal← 0
2:
3: for pos = 1 to pos < |c[]| − 2 do
4: C0← c[pos− 1]
5: C1← c[pos]
6: C2← c[pos+ 1]
7: C3← c[pos+ 2]
8: ⌈ ∥∥∥−−→C C ∥∥⌉1 2∥
9: numberO f PointsOnSegment← ∆s
10:
11: ∆ ← 1t numberO f PointsOnSegment
12:
13: for i = 0 to i < numberO f PointsOnSegment do
14: p[count+ i]← createPlanningPoint( interpolate( i · ∆t, C0, C1, C2, C3 ))
15: end for
16:
17: pointsTotal← pointsTotal + numberO f PointsOnSegment
18: end for
19:
20: lastWayPointIndex← |c[]| − 2
21: p[pointsTotal]← createPlanningPoint( c[ lastWayPointIndex ] )
22: return p[]
Die Assoziation eines Zeitpunkts ti mit dem jeweiligen internen Spline-
parameter ui über die Planungspunkte pi = Q(ui) bildet die Basis für eine
Reparametrisierung der Bahnkurve als eine Funktion über die Zeit. Über
eine geeignete Interpolation macht diese Reparametrisierung es möglich, für
jeden Zeitpunkt, der innerhalb der Durchlaufzeit der Trajektorie liegt, den
geplanten Ort, Geschwindigkeitsvektor sowie Beschleunigungsvektor zu
bestimmen. Dies bildet die Grundlage für eine laufende Zielanpassung des
untergeordneten Regelungsverfahrens, das die Durchführung der Objektbe-
wegung steuert.
Bewegungsgleichungen
Für die Bestimmung der Bewegungsgleichungen wird das Intervall zwi-
schen den Planungspunkten pi−1, pi vereinfacht als Strecke der Länge ∆s
angenommen. Die hier genannten und weitere in den folgenden Abschnitten
verwendeten Formelzeichen sind zur Übersicht in Tabelle 5.2 aufgelistet.
122 5 Verfahren zur kinodynamischen Bewegungsplanung
Tabelle 5.2 Abkürzungen und Variablen, die bei der Erzeugung des
Geschwindigkeitsprofils verwendet werden
Symbol Beschreibung
v Translationsgeschwindigkeit
vmax maximale Translationsgeschwindigkeit
at Translationsbeschleunigung
atmax maximale Translationsbeschleunigung
c Krümmung
az Zentripetalbeschleunigung
t Zeit seit Beginn des Bewegungsvorgangs über die Bahnkurve
pi i-ter Planungspunkt auf der Bahnkurve
∆s Streckenlänge zwischen zwei Planungspunkten
∆t Zeit für die Bewegung zwischen zwei Planungspunkten
Es lassen sich für das Intervall pi−1, pi folgende grundlegende Gleichungen
aufstellen:
1
s(t) = att2 + vi−1t, t ∈ [0,∆t], ∆t := ti − ti−1 (5.8)2
v
a = i
− vi−1
t (5.9)∆t
∆s = s(∆t) (5.10)
Die Funktion s(t) steht für den Weg, der seit Beginn des Intervalls zurückge-
legt wurde. Die Translationsbeschleunigung at wird innerhalb des Intervalls
als konstant angenommen. Die gesamte Streckenlänge des Intervalls wird
mit ∆s angegeben. Aus diesen grundlegenden Gleichungen können die ge-
schlossenen Formen für ∆t = ti − ti−1 und vi abgeleitet werden (vgl. [Spr08]
S. 22 ff):
√
v = v 2i i−1 + 2∆sat (5.11)
2∆
∆ st = (5.12)vi−1 + vi
Dabei ist zu beachten, dass negative Werte für die Zeit und die Geschwindig-
keit ausgeschlossen werden, es gelten also vi ≥ 0, vi−1 ≥ 0 und ∆t ≥ 0. Mit
Gleichung 5.11 lässt sich die Geschwindigkeit eines Planungspunktes aus
der Vorgängergeschwindigkeit, der Streckenlänge und der Beschleunigung
berechnen. Dies erlaubt eine iterative Bestimmung aller Geschwindigkeits-
werte eines Profils. Über Gleichung 5.12 lassen sich bei einem gegebenen
Geschwindigkeitsprofil die Durchlaufzeit für die einzelnen Intervalle, die
Zwischenankunftszeiten bei den Planungspunkten und somit auch die ge-
samte Durchlaufzeit der Bahnkurve bestimmen.
5.4 Numerisches Geschwindigkeitsprofil 123
Berücksichtigung kinodynamischer Zwangsbedingungen
Damit die Trajektorie mit ihrem Geschwindigkeitsprofil als Grundlage für ein
Kollisionsvermeidungsverfahren verwendet werden kann, ist es notwendig,
dass das physische Objekt in der Lage ist, die geplanten Bewegungen mög-
lichst exakt nachzuführen. Dazu müssen die jeweiligen kinodynamischen
Zwangsbedingungen des zu bewegenden Objekts bei der Erstellung des
Geschwindigkeitsprofils berücksichtigt werden. Alle Zwangsbedingungen
des physischen Objekts werden zu Zwangsbedingungen der translationalen
Geschwindigkeitsvektoren an den Planungspunkten transformiert.
Nach [Spr08] wird zwischen isolierten oder beschleunigungsbedingtenZwangs-
bedingungen unterschieden. Als isoliert werden diejenigen Zwangsbedin-
gungen bezeichnet, die von den Geschwindigkeitsvektoren der benachbarten
Planungspunkte unabhängig sind. Ein wichtiges Beispiel ist die maximale
Zentrifugalkraft, die auf ein Objekt wirken darf: Sie hängt ausschließlich von
der Krümmung und der translationalen Geschwindigkeit an einem betrach-
teten Punkt ab. Beschleunigungsbedingte Zwangsbedingungen hingegen
hängen von den Geschwindigkeitsvektoren der benachbarten Planungspunk-
te ab. Sie garantieren, dass die gewählte Geschwindigkeit an Planungspunkt
pi innerhalb der Grenzen bleibt, die durch die Translationsgeschwindig-
keit in pi−1 und die maximal zulässige Translationsbeschleunigung bzw.
-verzögerung vorgegeben ist.
Das im Rahmen dieser Arbeit verwendete Verfahren zur Erzeugung des
Geschwindigkeitsprofils berücksichtigt folgende Zwangsbedingungen:
• den Stillstand im Start- und Endpunkt,
• die maximale absolute Geschwindigkeit vtmax ,
• die Zentripetalbeschleunigung azmax , die zum Ausgleich der Zentrifugal-
kraft bei Fahrt in einer Kurve mit Krümmung c aufgewendet werden
muss sowie
• die maximale Translationsbeschleunigung und -verzögerung atmax .
Die ersten drei Bedingungen können, wie bereits beschrieben, isoliert be-
trachtet werden. Für die vierte Bedingung ist eine Betrachtung des jeweils
vorhergehenden und nachfolgenden Planungspunkts notwendig.
Start- und Endgeschwindigkeit
Jeder Bewegungsvorgang startet im Stillstand und endet mit dem Stillstand
des zu bewegenden Objekts. Dieser Umstand wird jeweils als Zwangsbedin-
gung am ersten und letzten Punkt des Geschwindigkeitsprofils {p0, · · · , pn}
abhängig vom Index i formuliert: {
0 für i = 0
vstart = (5.13)
∞ für i > 0
124 5 Verfahren zur kinodynamischen Bewegungsplanung
{
0 für i = n
vend = (5.14)∞ für i < n
Eine Implikation dieser Zwangsbedingungen ist, dass zwei Bewegungsvor-
gänge des gleichen Objekts nicht nahtlos mit einer Geschwindigkeit v > 0
nacheinander ablaufen können. Diese Vorgehensweise entspricht dem Be-
wegungsmodell der logistischen Standardliteratur (vgl. Abschnitt 5.5). Eine
Erweiterung dieses Verfahrens um beliebige Start- und Endgeschwindigkei-
ten wäre durch Wahl einer schwieriger handhabaren Spline-Familie möglich
(vgl. Abschnitt 5.3) und hätte Auswirkung auf das Verfahren der Kollisions-
vermeidung, das von einem stets sicheren Zustand in Start- und Endpunkt
ausgeht (vgl. Abschnitt 5.6).
Maximale absolute Geschwindigkeit
Mit vtmax wird die maximale absolute Geschwindigkeit des physischen Ob-
jekts beschränkt. Dies kann z. B. die aus Sicherheitsgründen erlaubte Höchst-
geschwindigkeit eines Fahrzeugs sein. Als isolierte Zwangsbedingung gilt sie
unabhängig in jedem Planungspunkt. Da Rückwärtsbewegung nicht erlaubt
ist, ergibt sich
vi ∈ [0,vtmax ]. (5.15)
Da in dieser Arbeit von einem holonomischen Bewegungsmodell ausgegan-
gen wird, kann der Unterschied zwischen translationaler und rotationaler
Geschwindigkeit vernachlässigt werden. Diese Zwangsbedingung impliziert,
dass ein Objekt auf einem langen, geradeaus verlaufenden Streckenstück
nicht beliebig schnell werden kann.
Maximale Zentripetalbeschleunigung
Sobald sich das Objekt nicht mehr auf einer geraden Strecke bewegt, erfährt
es eine Richtungsänderung beim Durchlaufen der Bahnkurve. Das Maß für
diese Änderung ist die Krümmung c, die als Kehrwert des Radius r des
Krümmungskreises in jedem Punkt P der Bahnkurve C definiert ist (siehe
Abbildung 5.8).
Für einen Kreis ist die Krümmung als Verhältnis von Zentriwinkel ∆ϕ und
Länge ∆s eines Kreisbogens definiert (vgl. Abbildung 5.9):
1 ∆ϕ
= . (5.16)
r ∆s
Der Zentriwinkel ist gleich dem Außenwinkel zwischen den Kreistangenten
in den Endpunkten des Kreisbogens. Die Krümmung κ an einem beliebigen
Punkt auf einer Kurve ist als Grenzwert definiert:
5.4 Numerisches Geschwindigkeitsprofil 125
c
r
P
Abb. 5.8 Bahnkurve c und ihr Krümmungskreis mit Radius r im Kurvenpunkt P
C
s
r
𝜋 − φ D
φ φ
A
r
B
Abb. 5.9 Krümmung am Kreis
∆ dϕ
κ := lim ϕ = . (5.17)
s→0 ∆s ds
Für die Berechnung einer approximierten Krümmung c für einen Planungs-
punkt pi im Geschwindigkeitsprofil werden der Vorgänger pi−1 und der
Nachfolger pi+1 als Endpunkte eines Kreisbogens auf dem Krümmungskreis
von pi betrachtet. Dies ist durch die äquidistante Verteilung der Planungs-
punkte möglich. Die Kreistangenten verlaufen durch die Strecken pi−1pi und
pipi+1. Ihr Innenwinkel ist als
θ = ∠pi−1pipi+1 (5.18)
definiert. Der Außenwinkel und damit auch der Zentriwinkel des Krüm-
mungskreises ergibt sich entsprechend durch
ϕc = π − θ. (5.19)
126 5 Verfahren zur kinodynamischen Bewegungsplanung
Damit kann der Krümmungsrad∥ius übe∥−−−→∥
r
ϕ
rc = pi−1pi∥ · tan c (5.20)2
bestimmt werden. Die maximale Geschwindigkeit in einem Planungspunkt
mit Krümmung c ergibt sich aus der maximalen Zentripetalbeschleuni-
gung azmax = atmax und dem Krümmungsradius. Die Verwendung von atmax
wird durch das holonomische Bewegungsmodell möglich. Damit kann die
Zwangsbedingung folgerndermaßen beschrieben werden:
vi ∈
√
[0,vzmax ], vzmax = atmaxrc. (5.21)
Diese Zwangsbedingung impliziert, dass in engen Kurven keine zu hohen Ge-
schwindigkeitsvorgaben an die untergeordnete Steuerung gemacht werden.
Die Approximation der Krümmung über die benachbarten Planungspunk-
te führt dazu, dass die Genauigkeit der Krümmungsbestimmung über die
Anzahl und den Abstand der Planungspunkte gesteuert wird.
Maximale Translationsbeschleunigung
Die maximale Translationsbeschleunigung atmax ist bei dem hier angenom-
menen holonomischen Bewegungsmodell symmetrisch für Beschleunigung
und Verzögerung. Die daraus folgende maximale Geschwindigkeit in Pla-
nungspunkt pi ist von den Geschwindigkeiten in den Punkten pi−1 und pi+1
abhängig. Durch atmax wird die erreichbare Geschwindigkeit auf einen Wert
vi ∈ [vamin ,vamax ] (5.22)
festgelegt, wobei die minimalen und maximalen erreichbaren Geschwindig-
keiten als
vamin =max{ vi−1 − atmax∆t1, vi+1 − atmax∆t2, 0 }, (5.23)
vamax =min{ vi−1 + atmax∆t1, vi+1 + atmax∆t2 } (5.24)
mit ∆t1 := ti − ti−1 und ∆t2 := ti+1 − ti definiert sind. Über Gleichung 5.11
erhält man eine Darstellung auf Basis der äquidistanten Strecken zwischen
den Planungspunkten:
√ √
vamin =max{ √ vi− 21 − 2at 2max∆s, √ vi+1 − 2atmax∆s, 0 }, (5.25)
va 2 2max =min{ vi−1 + 2atmax∆s, vi+1 + 2atmax∆s } (5.26)
5.5 Bestimmung der Geschwindigkeiten 127
Es ist anzumerken, dass zwischen zwei Planungspunkten entweder positiv
beschleunigt oder gebremst werden kann. Damit ist auch hier die Anzahl der
Planungspunkte für die Genauigkeit der Steuerung ausschlaggebend.
Erfüllung der Zwangsbedingungen
Da für alle Zwangsbedingungen eine Gleichung gefunden wurde, die sich
ausschließlich auf die Positionen der Punkte pi−1, pi und pi+1 und die maxi-
male Beschleunigung atmax bezieht, kann die Erfüllung aller Zwangsbedin-
gungen durch das Minimum aller berechneten maximalen Geschwindigkei-
ten für den Punkt pi durchgeführt werden:
vi←min{vstart,vend,vtmax ,vzmax ,vamax}. (5.27)
Durch das holonomische Bewegungsmodell, das ohne Drehbeschleunigung
auskommt, entstehen keine Konflikte zwischen gültigen Geschwindigkeits-
intervallen bei der Bestimmung einer gültigen Geschwindigkeit. Für kom-
plexere Bewegungsmodelle gibt es Verfahren, die diese Problemstellungen
lösen (vgl. [Spr08]). Im Rahmen dieser Arbeit reicht zur Validierung der
Kollisionsvermeidung das gewählte Bewegungsmodell aus.
5.5 Bestimmung der Geschwindigkeiten
Die Erstellung eines Geschwindigkeitsprofils, das die genannten Zwangsbe-
dingungen berücksichtigt, geschieht in zwei Phasen:
1. Berechnen der Translationsgeschwindigkeit vi und Ankunftszeit ti für
jeden Planungspunkt pi durch Verwendung der Bewegungsgleichungen
und mit den genannten Zwangsbedingungen auf dem Intervall pi−1, pi
für jeden Planungspunkt mit i ∈ 1, · · · ,n in aufsteigender Indexreihenfol-
ge
2. Berechnen der Translationsgeschwindigkeit vi und Ankunftszeit ti für
jeden Planungspunkt pi durch Verwendung der Bewegungsgleichungen
und mit den genannten Zwangsbedingungen auf dem Intervall pi+1, pi
für jeden Planungspunkt mit i ∈ n− 1, · · · ,0 in absteigender Indexreihen-
folge
Es ist zu beachten, dass bei der Bestimmung der Translationgeschwindigkeit
nicht zwingend der maximal mögliche Wert angenommen muss. Weitere Be-
dingungen können eine langsamere Bewegung über die Bahnkurve erfordern
(wie z. B. zur Kollisionsvermeidung). Ohne solche zusätzlichen Bedingungen
wird im Rahmen dieser Arbeit jedoch eine zeitoptimale Bewegung verwendet,
bei der die maximal mögliche Beschleunigung und Verzögerung angenom-
men wird. Ein solcher Ansatz wird auch Bang-Bang-Methode genannt. Der
Name ist lautmalerisch gemeint und beschreibt die Vorgehensweise, mit ma-
128 5 Verfahren zur kinodynamischen Bewegungsplanung
Algorithmus 3 Bestimmung der maximalen Geschwindigkeiten für isolierte
Zwangsbedingungen
Eingabe: Sequenz der Planungspunkte p[], Maximalbeschleunigung atmax , Maximalge-
schwindigkeit vtmax , Start- und Endgeschwindigkeit vstart = 0, vend = 0
Ausgabe: Sequenz der maximalen Geschwindigkeiten in den Planungspunkten vmax []
1: n← |p[]|
2:
3: for i = 1 to i < n− 1 do
4: P0← position( p[i− 1] )
5: P1← position( p[i] )
6: P2← position( p[i+ 1] )
7:
8: ϕc←∥∥∥π −∠−−→∥9: rc← P0P1∥∥P0P1P2· tan ϕc2
10: √
11: vzmax ← atmax rc
12:
13: vmax [i]←min( vzmax , vtmax )
14: end for
15:
16: vmax [0]← vstart
17: vmax [n− 1]← vend
18: return vmax []
ximaler Beschleunigung zuerst vorwärts und dann rückwärts die Planungs-
punkte zu durchlaufen. Diese Methode gilt als effizienter in der Berechnung
als z. B. Ansätze mit dynamischer Programmierung (vgl. [LaV06] Kapitel
14.6.3.5).
Zusammenhang mit der analytischen Wegzeitberechnung in der
logistischen Standardliteratur
Zur analytischen Bestimmung von Wegzeiten werden in der Standardlite-
ratur verschiedene Methoden besprochen (vgl. [tSB11, S. 127ff]). Allen ist
gemein, dass sie die Zeit t zum Zurücklegen eines Weges wie im vorheri-
gen Abschnitt beschrieben aus drei Größen berechnen: der Wegstrecke s,
der Geschwindigkeit v und der Beschleunigung a. Genauso wie zwischen
zwei Planungspunkten im numerischen Geschwindigkeitsprofil wird die
Beschleunigung als konstant angenommen, sodass sich ein linearer Zeit-
Geschwindigkeits-Verlauf ergibt. Als einzige kinodynamische Zwangsbedin-
gung wird die maximale Geschwindigkeit vmax berücksichtigt. In Abhängig-
keit davon, ob diese maximale Geschwindigkeit auf der Wegstrecke s erreicht
wird, ergibt sich eine vereinfachte Bewegungsgleichung, die zwischen einer
sog. Standardfahrrampe und einer sog. spitzen Fahrrampe unterscheidet:
5.5 Bestimmung der Geschwindigkeiten 129
Algorithmus 4 Zeitoptimale Bestimmung des Geschwindigkeitsprofils unter
beschleunigungsbedingten Zwangsbedingungen (Bang-Bang-Methode)
Eingabe: Sequenz der Planungspunkte p[], Sequenz der maximalen Geschwindigkeiten
in den Planungspunkten vmax [], Maximalbeschleunigung atmax
Ausgabe: Sequenz der Geschwindigkeiten in den Planungspunkten v[]
1: n← |p[]|
2: v[0]← 0
3:
4: for i = 1 to i < n do
5: P0← position( p[i− 1] )
6: P1← p∥ositio∥n( p[i] )7:
← ∥∥−−→8: ∆s √P P
∥
0 1∥
9:
10: va← v[i− 1]2 + 2atmax ∆s
11:
12: v[i]←min( va, vmax [i] )
13: end for
14:
15: v[n− 1]← 0
16:
17: for j = n− 1 to j > 0 do
18: P0← position( p[j] )
19: P1← p∥ositio∥n( p[j− 1] )20:
21: ∆ ← ∥∥−−→s √P
∥
0P1∥
22:
23: va← v[j]2 + 2atmax ∆s
24:
25: v[j− 1]←min( va, v[j− 1] )
26: end for
27:
28: return v[]  s
t = v +√
v ≥ v2a für s a Standardfahrrampe
2 · s v2
(5.28)
a für s < a spitze Fahrrampe
Der Zusammenhang ist graphisch in Abbildung 5.10 dargestellt. Die Zeiträu-
me ∆t+a und ∆t−a beschreiben die Zeit, die zum Beschleunigen bzw. Verzögern
aufgewandt wird. Die Fläche, die für diesen Bereich der x-Achse eingeschlos-
sen wird, entspricht der zurückgelegten Strecke in diesen Zeitanteilen. Ist
die Strecke s ausreichend lang, um vmax zu erreichen, kommt ein dritter
Zeitanteil ∆tc hinzu, in dem die Bewegung mit konstanter Geschwindigkeit
erfolgt.
Es kann gezeigt werden, dass beide Fälle als Spezialfälle des in dieser Ar-
beit entwickelten allgemeinen Verfahrens abgebildet werden können. Dazu
130 5 Verfahren zur kinodynamischen Bewegungsplanung
Algorithmus 5 Bestimmung der Zeiten und Distanzen im Geschwindigkeits-
profil unter Berücksichtigung von Wartezeiten im Stillstand
Eingabe: Geschwindigkeitsprofil mit Wartezeiten (p[], v[], twait[])
Ausgabe: Sequenz der Zeitpunkte und Distanzen t[], s[]
1: n← |p[]|
2:
3: t[0]← 0
4: s[0]← 0
5:
6: for i = 1 to i < n do
7: P0← position( p[i− 1] )
8: P1← p∥osition( p[i] )9:
← ∥∥−−→∥10: ∆s P P ∥0 1∥
11:
12: s[i]← s[i− 1] + ∆s
13:
14: t[i]← ∆s
v[i−1] + 12 v[i] − v[i−1]
15:
16: if v[i− 1] = 0 then
17: t[i]← t[i] + twait[i− 1]
18: end if
19: end for
20:
21: return t[], s[]
v v
vmax vmax
t t
∆t+a ∆tc ∆t− + +a ∆ta ∆ta
Abb. 5.10 Standardfahrrampe (links) und spitze Fahrrampe (rechts)
wird im zweidimensionalen Raum ein Catmull-Rom-Spline aus den vier
Kontrollpunkten P0,P1,P2,P3 gebildet, von denen P1 und P2 als Anfangs-
und Endpunkt der Wegstrecke den euklidischen Abstand s besitzen. Die
zusätzlich notwendigen Kontrollpunkte P0 und P3 werden anhand von Glei-
chung 5.5 und Gleichung 5.6 bestimmt. Aus dieser spezifischen Konstruktion
des Splines ergibt sich eine geradlinige Bahnkurve ohne Krümmung, sodass
die maximale Zentripetalbeschleunigung als Zwangsbedingung vernach-
lässigt werden kann. Die maximale Translationsgeschwindigkeit wird als
vtmax = vmax definiert, und zur Berechnung von vamax wird Gleichung 5.26
mit atmax = a verwendet.
5.6 Kollisionsfreie Bewegung mehrerer Objekte 131
Durch die im vorherigen Abschnitt beschriebene Bang-Bang-Methode ent-
stehen im Geschwindigkeitsprofil die exakten Geschwindigkeitsverläufe der
Fahrrampen aus Abbildung 5.10 genau dann, wenn der Abstand ∆s zwischen
2
den Planungspunkten so gewählt wird, dass ∆s = n va mit n ∈N+ gilt.
Daraus folgt, dass die in dieser Arbeit entwickelte Methode in allen logis-
tischen Anwendungsfällen eingesetzt werden kann, die auf die klassische
analytische Wegzeitberechnung der Standardliteratur zurückgreifen.
5.6 Kollisionsfreie Bewegung mehrerer Objekte
Bislang wurde die Bewegung eines einzelnen physischen Objekts isoliert
untersucht. Nun soll die Bewegung des Objekts in einer globalen Umgebung
betrachtet werden, in der sich bereits eine Mehrzahl von Objekten bewegen.
Die Grundlage für eine formale Beschreibung dieser globalen Umgebung
ist eine Menge von existierenden Trajektorien T für physische Objekte im
logistischen Raum. Der Aufenthalt jedes einzelnen Objekts ist so durch einen
Punkt p ∈P und den dazugehörigen Zeitpunkt tp bestimmt. Die Menge
P enthält alle Punkte im logistischen Raum, die über die in T enthaltenen
Bahnkurven repräsentiert werden.
Aus dem Axiom der Trennung folgt, dass Objekte sich nicht zur gleichen
Zeit am gleichen Ort befinden können. Da ein physisches Objekt eine räumli-
che Ausdehnung besitzt, gibt es für jeden Punkt p mit seinem zugeordneten
Zeitpunkt tp eine Nachbarschaft Np ⊂P als Menge aller Punkte, die zum
Zeitpunkt tp nicht belegt sein dürfen. Für jeden Punkt q ∈Np mit dem Zeit-
punkt tq gilt tq 6= tp. Ein Punkt p, dessen Nachbarschaft zu seinem Zeitpunkt
nicht belegt ist, heißt kollisionsfrei. Eine Menge von Trajektorien T , deren
Punkte p ∈P kollisionsfrei sind, gilt ebenfalls als kollisionsfrei.
In den folgenden Abschnitten soll nun ein Verfahren entwickelt werden,
das für eine gegebene Trajektorie T die Kollisionsfreiheit in Bezug auf die
Menge von bereits existierenden Trajektorien T sicherstellt. Dazu wird in
einem ersten Schritt eine neue Art von zeitbasierter Zwangsbedingung for-
muliert, die für Intervalle zwischen den Planungspunkten von T gilt, die
Punkte innerhalb der Nachbarschaften bereits existierender Trajektorien
enthalten. In einem zweiten Schritt wird die Erfüllung dieser neuen Zwangs-
bedingung betrachtet und eine Methode vorgestellt, die durch Veränderung
des Geschwindigkeitsprofils eine Kollisionsfreiheit von T in Bezug auf T
gewährleistet.
Mögliche Kollisionsbereiche
Über die Struktur des Geschwindigkeitsprofils von T können die möglichen
Kollisionsbereiche mit anderen Profilen aus T anhand der örtlichen Position
der Planungspunkte zueinander bestimmt werden. Wenn davon ausgegan-
gen wird, dass alle physischen Objekte die gleiche Ausdehnung haben, die
132 5 Verfahren zur kinodynamischen Bewegungsplanung
durch einen Kreis mit Radius robj gegeben ist, dann lässt sich die Prüfung auf
mögliche Kollisionen auf einen Vergleich zwischen den Planungspunkten
reduzieren, solange deren äquidistanter Abstand ∆s so gering ist, dass keine
zu großen Lücken entstehen.
Unter diesen Voraussetzungen kann eine Nachbarschaft Np für jeden
Planungspunkt p ∈ PT definiert werden, die alle Planungspunkte q ∈ PT
anderer Trajektorien enthält, deren Distanz dpq < 2robj ist. Im zweidimen-
sionalen logistischen Raum kann dpq als euklidische Distanz zwischen den
Punkten p(x1,y1) und q(x2,y√2) über
dpq = (x1 − x2)2 + (y1 − y2)2
berechnet werden.
Mögliche Kollisionsbereiche einer Trajektorie können so über jeden Pla-
nungspunkt p ∈ PT identifiziert werden, bei dem Np 6= ∅ ist. Im glei-
chen Zuge lassen sich für vollständig disjunkte Trajektorien, bei denen
∀Np ∈ NT ,Np =∅ gilt, Kollisionen grundsätzlich ausschließen. NT bezeich-
net dabei die Gesamtheit aller Nachbarschaften aller Planungspunkte einer
Trajektorie.
In dieser Arbeit wird davon ausgegangen, dass Anfangs- und Endpunkt
einer Trajektorie immer kollisionsfrei sind, daher für p0, pn ∈ {p0, · · · , pn} |
Np0 = ∅,Npn = ∅ gelten. Sie bilden sichere Bereiche, sodass am Anfang
und Ende des Bewegungsvorgangs eine Planungssicherheit bezüglich der
Kollisionsvermeidung besteht.
Zeitbasierte und kollisionsbedingte Zwangsbedingungen
Über die Menge der Nachbarschaften NT können die möglichen Kollisionsbe-
reiche auf zeitbasierte Zwangsbedingungen für das Geschwindigkeitsprofil
von T abgebildet werden.
Die Funktion collT :Np→CT gibt für jeden Planungspunkt pi ∈ {p0, · · · , pn}
die Menge Cpi ∈ CT von Zeitintervallen zurück, die Belegungszeiten für Npi
angeben, die eine Anwesenheit fremder Objekte innerhalb der Nachbarschaft
repräsentieren. Der Punkt pi gilt dann als kollisionsfrei, wenn tpi außerhalb
der in Cpi enthaltenen Intervalle liegt. Für jedes Intervall [t1, t2] ∈ Cpi muss
gelten tpi < t1 ∨ tpi > t2.
Die Erfüllung dieser zeitbasierten Zwangsbedingungen hängt von der
Fähigkeit ab, den Zeitpunkt tpi so festzulegen, dass er außerhalb der Be-
legungsintervalle liegt. Die validen Werte von tpi hängen jedoch von den
Bewegungsgleichungen und kinodynamischen Zwangsbedingungen ab. Aus
Gleichung 5.12, Gleichung 5.23 und Gleichung 5.27 ergibt sich:
2∆ 2∆
t s spi−1 + ≤ tv pi ≤ tpi−1 + (5.29)amin min{vstart,vend,vtmax ,vzmax ,vamax}
5.6 Kollisionsfreie Bewegung mehrerer Objekte 133
Eine isolierte Erfüllung der zeitlichen Zwangsbedingungen in pi kann nur in
den engen Grenzen der minimal und maximal möglichen Geschwindigkeits-
änderung zum vorherigen Planungspunkt pi−1 erfolgen. Zusätzlich ist mit
∆s < 2robj die zur Verfügung stehende Wegstrecke begrenzt.
Für eine allgemeine Erfüllung der Zwangsbedingung in pi muss diese
bei Bedarf auf die vorherigen Punkte propagiert werden können. Da die
Generierung des Geschwindigkeitsprofils zeitoptimal durchgeführt wird,
daher mit maximal möglicher Geschwindigkeit, kann eine Veränderung von
tpi nur durch eine Verringerung von Geschwindigkeiten erreicht werden.
Dazu wird die zeitliche Differenz ∆tcoll definiert, die notwendig ist, um in
pi eine Kollision zu verhindern. Zur Bestimmung von ∆tcoll werden alle die
Zeitintervalle [t1, t2] ∈ Cpi betrachtet, für die tpi ≥ t1 ∧ tpi ≤ t2 gilt. Wenn t1min
der früheste Zeitpunkt ist, an dem die Kollisionsintervalle beginnen, dann ist
∆tcoll = tpi − t1min . (5.30)
Mit ∆tcoll ist nun die Zeit bestimmt, die auf der Teilsequenz {p0, · · · , pi} zur
Erfüllung der zeitlichen Zwangsbedingung zusätzlich verbracht werden
muss. Dies kann durch
• Verringerung der Geschwindigkeiten oder
• Warten im Stillstand
geschehen. Für das Warten im Stillstand muss beachtet werden, dass es nicht
in pi stattfinden kann, da hier ja schon die Kollision stattfindet. Es muss daher
auf den vorherigen Planungspunkt pi−1 gelegt werden, der nicht kollisions-
gefährdet ist. In beiden Fällen kann ein neues Geschwindigkeitsprofil, das
in pi kollisionsfrei ist, generiert werden. Die Auswahl einer geeigneten Lö-
sungsstrategie muss berücksichtigen, dass jede Veränderung der Zeitpunkte
{tp1 , · · · , tpi−1} zu neuen Kollisionen führen kann, die anschließend aufgelöst
werden müssen.
In den folgenden Abschnitten wird ein Verfahren vorgestellt, das eine
möglichst geringe Anzahl an Planungspunkten verändert. In einem ersten
Schritt wird dazu eine Methode zur Erlangung der Kollisionsfreiheit in pi ent-
wickelt und anschließend, in einem zweiten Schritt, werden neu auftretende
Kollisionen in vorausgehenden Punkten aufgelöst.
Anpassung des Geschwindigkeitsprofils zur Kollisionsfreiheit in einem
Planungspunkt
Wie im vorherigen Abschnitt beschrieben, kann eine isolierte Anpassung der
Geschwindigkeit in pi nicht ausreichend sein, da die zusätzlich benötigte
Fahrtzeitverlängerung ∆tcoll zu lang ist. Wenn zudem einWarten im Stillstand
notwendig ist, dann muss dieses außerhalb des Kollisionsbereichs in Punkt
pi−1 stattfinden. Daher werden die benötigten Geschwindigkeitsreduktio-
nen unter Berücksichtigung der kinodynamischen Zwangsbedingungen auf
134 5 Verfahren zur kinodynamischen Bewegungsplanung
die Planungspunkte {p0, · · · , pi−1} verteilt. Es erscheint dabei günstig, dass
möglichst wenige Punkte betroffen sind, da so die Änderungen amGeschwin-
digkeitsprofil lokal beschränkt bleiben. Die Begründung hierfür ist an dieser
Stelle der Arbeit als intuitiv und heuristisch zu sehen. Das ursprüngliche
Geschwindigkeitsprofil wurde mit maximaler Beschleunigung zeitoptimal
geplant. Im Gegenzug dazu soll hier die gezielte Fahrtzeitverlängerung mit
maximaler Verzögerung raumoptimal erfolgen.
Das Verfahren beginnt mit der Festlegung einer reduzierten Zielgeschwin-
digkeit vi−1red < vi−1 in pi−1 und passt anschließend iterativ die Geschwindig-
keiten der vorhergehenden Punkte unter Berücksichtigung der kinodynami-
schen Zwangsbedingungen an. Sobald der Punkt pi−x erreicht wird, an dem
keine Anpassung mehr notwendig ist, wird die erreichte Fahrtzeitverlänge-
rung ∆tadd berechnet. Die genaue Anzahl x an vorhergehenden Punkten, die
verändert werden müssen, hängt vom Verlauf des Geschwindigkeitsprofils
ab. Wenn ∆tadd ≥ ∆tcoll , dann ist eine gültige Lösung gefunden worden.
Damit die Fahrtzeit nicht unnötig verlängert wird, sollte ∆tadd auch nicht
deutlich größer als ∆tcoll sein. Die Aufgabe des Verfahrens ist also die Suche
nach einer passenden reduzierten Zielgeschwindigkeit vi−1red aus dem Inter-
vall [0,vi−1[. Dazu wird initial ∆tadd für vi−1red = 0 bestimmt. Basierend auf
dem Ergebnis ergeben sich drei Fälle:
• Wenn ∆tadd < ∆tcoll , dann wird in Punkt pi im Stillstand zusätzlich twi−1 =
∆tcoll − ∆tadd gewartet.
• Wenn ∆t ∼add = ∆tcoll , dann ist eine adäquate Lösung gefunden.
• Andernfalls gibt es eine höhere Geschwindigkeit aus ]0,vi−1[, die be-
stimmt werden muss.
Im letzten Fall wird so lange eine neue reduzierte Zielgeschwindigkeit über
eine binäre Suche im Intervall ]0,vi−1[ bestimmt, bis ∆t ∼add = ∆tcoll .
Das erste Ergebnis dieser Methode, die passende reduzierte Zielgeschwin-
digkeit vi−1red , wird als neue kollisionsbedingte Zwangsbedingung in pi−1
eingeführt. Das zweite Ergebnis, die Wartezeit twi−1 , wird als neue Struktur
in das Geschwindigkeitsprofil aufgenommen. Die neue maximale Geschwin-
digkeit in pi−1 ergibt sich aus einer erweiterten Gleichung 5.27:
vi−1←min{vstart,vend,vtmax ,vzmax ,vamax ,vi−1red}. (5.31)
Anschließend wird ein neues Geschwindigkeitsprofil für die gesamte Trajek-
torie mithilfe der Bang-Bang-Methode aus Abschnitt 5.5 generiert. Dabei wird
das neu eingeführte Attribut ti−1w berücksichtigt, sodass
2∆
t t spi = pi−1 + + t (5.32)v i−1wi−1
mit
5.6 Kollisionsfreie Bewegung mehrerer Objekte 135
Algorithmus 6 Bestimmung der kollisionsfreien Maximalgeschwindigkeit
und Wartezeit in einem Planungspunkt unter Berücksichtigung einer kol-
lisionsbedingten zeitlichen Zwangsbedingung (gezieltes Bremsen auf der
Bahnkurve)
Eingabe: Geschwindigkeitsprofil (p[], v[], t[]), Index des Planungspunktes mit Kollision
index, Benötigte Verzögerungszeit tdelay, Schrittweite der iterativen Geschwindigkeits-
reduktion ∆v, Maximalbeschleunigung atmax
Ausgabe: Kollisionsfreie Maximalgeschwindigkeit im Planungspunkt vmax, Wartezeit
twait (bei vmax = 0)
1:
2: if index = 0 then
3: return vmax← 0, twait← tdelay
4: end if
5: ⌊ ⌋
6: n ← v[index]v ∆ + 1v
7:
8: for xv = 0 to xv < nv do
9: vstart← xv · ∆v
10: vtest← vstart
11: ttest← 0
12: i← index− 1
13:
14: repeat
15: P0← p[i+ 1]
16: P1← p[i]
17:
18: ∆ ← ∥∥∥−−→∥s P0P ∥1∥
19:
20: v′test← vtest
21: t′test← ttest
22: √
23: vtest←min( v′ 2test + 2atmax ∆s , v[i] )
24:
25: t ′ ∆test← t stest + v′ 1 ′test + 2 vtest − vtest
26:
27: i← i− 1
28: until vtest = v[i]
29:
30: toriginal ← t[index− 1]
31: tnew← t[i] + ttest
32: ∆t← toriginal − tnew
33:
34: if ∆t < tdelay then
35: if vstart = 0 then
36: return vmax← 0, twait← tdelay − ∆t
37: else
38: return v ′max← vtest, twait← 0
39: end if
40: end if
41: end for
136 5 Verfahren zur kinodynamischen Bewegungsplanung
{
≥ 0 für v
t = i−1
= 0
i−1w (5.33)0 sonst.
Das neu enstandene Geschwindigkeitsprofil ist in pi kollisionsfrei, jedoch
können in den veränderten vorherigen Punkten {pi−x, · · · , pi−1} und nach-
folgenden Punkten {pi+1, · · · , pi+y} neue Kollisionen entstehen. Daher wird
im nächsten Schritt ein Verfahren zur Erreichung der Kollisionsfreiheit ent-
wickelt, das die gesamte Trajektorie berücksichtigt.
Iterative Anpassung des Geschwindigkeitsprofils auf der gesamten
Trajektorie
Das Ziel des Verfahrens ist die Kollisionsfreiheit durch Erfüllung der zeit-
lichen Zwangsbedingungen in allen Planungspunkten {p0, · · · , pn}. Dazu
werden folgende Schritte durchlaufen:
1. Setze pi := p0.
2. Bestimme die zeitlichen Zwangsbedingungen Cpi , wie in Abschnitt 5.6
beschrieben.
3. Wenn keine Kollision in pi gegeben ist, dann springe zu Schritt 6. An-
dernfalls erfülle die zeitlichen Zwangsbedingungen, wie in Abschnitt 5.6
beschrieben, durch Bestimmung einer kollisionsbedingten Maximalge-
schwindigkeit und Wartezeit in pi−1.
4. Lösche alle eventuell vorhandenen kollisionsbedingtenMaximalgeschwin-
digkeiten und Wartezeiten in den nachfolgenden Punkten {pi, · · · , pn−1}.
5. Generiere ein neues Geschwindigkeitsprofil, das die Punkte {pi−x, · · · , pi+y}
verändert. Setze pi := pi−x. Springe zu Schritt 3.
6. Setze pi := pi+1 für i < n und springe zu Schritt 2. Wenn pn erreicht ist,
beende das Verfahren.
Dieses Verfahren kann als ereignisdiskrete Simulation aufgefasst werden, da
die Planungspunkte {p0, · · · , pn}, an denen relevante Ereignisse stattfinden
können, in der monoton steigenden zeitlichen Sequenz {t0, · · · , tn} durchlau-
fen werden. Der Bewegungsvorgang des Objekts wird so lange auf Basis des
jeweils aktuellen Geschwindigkeitsprofils simuliert, bis ein Kollisionsereig-
nis auftritt. In diesem Fall wird das Profil aktualisiert und ein sogenanntes
Roll-back, ein Sprung auf einen früheren Zeitpunkt, durchgeführt. Dies ist
nur deswegen möglich, weil die globale Umgebung zu keinem Zeitpunkt
verändert wird, sondern ausschließlich die eigene Trajektorie. Die Simulation
wird beendet, wenn ein Geschwindigkeitsprofil gefunden wurde, das ohne
Kollisionsereignisse die zeitliche Sequenz {t0, · · · , tn} durchlaufen kann.
Aus algorithmischer Sicht ist zu klären, ob das Verfahren auf allen Ein-
gaben terminiert und welche Worst Cases und Best Cases es bezüglich der
Durchlaufzeit tn und der algorithmischen Laufzeit gibt. Als Eingaben sind
5.6 Kollisionsfreie Bewegung mehrerer Objekte 137
Algorithmus 7 Iterative Anpassung des Geschwindigkeitsprofils
Eingabe: Einzeln geplantes Geschwindigkeitsprofil p[], Menge bereits existierender Ge-
schwindigkeitsprofile T
Ausgabe: Kollisionsfreies Geschwindigkeitsprofil mit kollisionsbedingten Maximalge-
schwindigkeiten und Wartezeiten (p[],vmax [], twait[])
1: n← |p[]|
2: i← 1
3:
4: for j = 0 to j < n do
5: vmax [j]←∅
6: twait[j]←∅
7: presences[j]←∅
8: end for
9:
10: repeat
11: if presences[i] =∅ then
12: presences[i]← computePresences( neighbourhood( p[i], T ))
13: end if
14:
15: ti← time( p[i] )
16: tdelay← collisionDetection( presences[i], ti )
17:
18: if tdelay > 0 then
19: vmax [i− 1], twait[i− 1], x← computeVelocityConstraints( p[], i, tdelay )
20:
21: for j = i to j < n do
22: vmax [j]←∅
23: twait[j]←∅
24: end for
25:
26: p[]← computeVelocityProfile( p[], vmax [], twait[], x )
27:
28: i← i− x
29: else
30: i← i+ 1
31: end if
32: until i = n
die zu planende Trajektorie T sowie die globale Umgebung in Form der
endlichen Menge an bereits existierenden Trajektorien T gegeben.
Terminiertheit
Das Verfahren ist genau dann terminierend, wenn nachgewiesen werden
kann, dass für alle Eingaben ein Zustand erreicht wird, in dem in Schritt 3
keine Kollisionen mehr festgestellt werden und somit keine Endlosschleife
entsteht. Dieser Nachweis wird über die Endlichkeit der Menge T geführt.
Wenn mit td die Durchlaufzeit einer Trajektorie aus T definiert wird, dann
muss es aufgrund der Endlichkeit der Menge einen Zeitpunkt tdmax für T
138 5 Verfahren zur kinodynamischen Bewegungsplanung
geben, nach dem es keine Kollisionen mehr geben kann. Da das Verfahren
über die zeitlichen Zwangsbedingungen alle Kollisionen von T für jeden
Punkt pi vermeidet, indem es in pi−1 wartet, ist es für alle Eingaben möglich
den Zeitpunkt tdmax in p0 abzuwarten und so einen Zustand zu erreichen,
in dem keine Kollisionen mehr festgestellt werden. Voraussetzungen für
die Terminiertheit sind also die vorab definierte Kollisionsfreiheit in p0, die
Endlichkeit von T sowie die Forderung, dass die Trajektorien in T nicht
geändert werden dürfen.
Best- und Worst-Case-Durchlaufzeit
Wenn td die zeitoptimale Durchlaufzeit von T mit T = ∅ ist, dann könnenf rei
mit td und tdworst die Best- und Worst-Case-Durchlaufzeiten folgender-best
maßen bestimmt werden:
td = td (5.34)best f rei
tdworst = tdmax + td (5.35)f rei
Die Aussagekraft dieser Betrachtung für die praktische Anwendung ist rela-
tiv begrenzt, da sie die Anzahl der Trajektorien in T , die Größe des logisti-
schen Raums und die Lage der Bahnkurven im Raum nicht berücksichtigt.
Eine Veränderung der Lage der Bahnkurven im Raum liefert den Spielraum
für die Entwicklung heuristischer Verfahren zur Verbesserung der Durchlauf-
zeit.
Best- und Worst-Case-Laufzeit
Die Laufzeit des Verfahrens ist ein wichtiger Faktor für die praktische An-
wendbarkeit. Als Metrik wird hier die Laufzeit lT gewählt, die sich aus
den Laufzeiten für jede Operation o ∈O zusammensetzt, die während des
Verfahrens beim Besuch eines Planungspunkts durchgeführt werden. Die
Funktion l :O→R+ gibt die spezifische Laufzeit für eine Operation zurück.
Die Operationen aus O lassen sich in drei Klassen unterteilen:
• Einmalige Operationen Für alle Besuche sind in einer einmaligen Ope-
ration o1 die Nachbarschaft zu bestimmen und die Kollisionsintervalle
zu erstellen.
• Wiederholte Operationen Für alle Besuche wird in der Operation o2
geprüft, ob eine Kollision vorliegt.
• Zusätzliche Operationen für Besuche mit Kollision Im Fall einer Kol-
lision wird in der Operation o3 eine neue, kollisionsbedingte Zwangs-
bedingung wie in Abschnitt 5.6 beschrieben eingeführt. Dies kann eine
binäre Suche nach der passenden reduzierten Höchstgeschwindigkeit
5.6 Kollisionsfreie Bewegung mehrerer Objekte 139
beinhalten. Anschließend wird in der Operation o4 ein neues Geschwin-
digkeitsprofil generiert.
Für eine effiziente Bestimmung der Nachbarschaft kann eine raumzeitliche
Datenstruktur für T verwendet werden (z. B. ein einfaches Grid oder ein
Octree). Die Prüfung auf Kollision besteht aus einem einfachen Test, ob die
Zwischenankunftszeit innerhalb eines oder mehrerer Kollisionsintervalle
liegt.
Im Fall einer erkannten Kollision erhöht sich nicht nur die Berechnungszeit
während des Besuchs erheblich (in Relation zu den Besuchen ohne Kollision),
sondern es werden durch die Veränderung des Geschwindigkeitsprofils in
{pi−x, · · · , pi+y}möglicherweise neue Kollisionen und damit neue Besuche
erzeugt. Es müssen alle Punkte {pi−x, · · · , pi−1} erneut besucht und geprüft
werden. Da die Anzahl an zusätzlichen Besuchen x durch den individuellen
Verlauf des Geschwindigkeitsprofils variieren kann, wird hier in der Worst-
Case-Betrachtung von einer mittleren Anzahl x an zusätzlichen Besuchen
ausgegangen.
Der Best Case ist ein Durchlauf des Verfahrens ohne Kollisionen, die
Anzahl der Besuche ist bei einem Geschwindigkeitsprofil {p0, · · · , pn}:
lTbest = (n− 2) ( l(o1) + l(o2) ) (5.36)
Zusätzlich finden bei den Besuchen keine aufwändigen Operationen der
dritten und vierten Klasse statt.
Für die Konstruktion eines Worst Case ist eine spezifische Lage der Bahn-
kurven im Raum notwendig, die zu zahlreichen Kollisionsereignissen führt.
Ein mögliches Worst-Case-Szenario ist in Abbildung 5.11 skizziert. Gegeben
ist die Trajektorie T′ mit dem Geschwindigkeitsprofil {p0, · · · , pn} sowie eine
Sequenz an existierenden Trajektorien {T0, · · · ,Tm} ∈ T . Die Bahnkurven
aller Trajektorien aus T werden so gelegt, dass sie die Bahnkurve von T′ in
gegenläufiger Fahrtrichtung durchlaufen. In den Nachbarschaften der Pla-
nungspunktsequenz {pn−1, · · · , p1} entstehen so für jede Trajektorie Tj ∈ T
Kollisionsintervalle mit monoton steigenden Startzeitpunkten, die als Se-
quenz {tjn−1 , · · · , tj1} dargestellt werden. Für T und T0 werden die Geschwin-
digkeitsprofile so eingestellt, dass die Zwischenankunftszeit tn−1 in pn−1 im
Kollisionsintervall von T0 liegt. Daraufhin erstellt das Verfahren ein neues
Geschwindigkeitsprofil für T′, sodass diese Kollision durch Fahrtzeitverzö-
gerung vermieden wird. Durch die Lage der Bahnkurven ensteht die nächste
Kollision in pn−2, die als nächstes behoben wird. Dieser Ablauf muss für alle
Punkte in {pn−1, · · · , p1} durchgeführt werden, bis alle Kollisionen zwischen
T′ und T0 aufgelöst sind. Analog werden die Geschwindigkeitsprofile von T1
bis Tm angelegt, sodass das Verfahren für alle Trajektorien in T die maximal
mögliche Anzahl an Operationen der dritten Klasse ausführen muss.
140 5 Verfahren zur kinodynamischen Bewegungsplanung
Abb. 5.11Worst-Case-Szenario für die Laufzeit des Verfahrens
Somit kann die Laufzeit für das Worst-Case-Szenario folgendermaßen ange-
geben werden:
lTworst = lTbest + (n− 2) m ( l(o2) + l(o3) + l(o4) ) + (n− 2) m x l(o2)
(5.37)
Die Formel besteht aus der Best-Case-Laufzeit, der Laufzeit für die Kollisions-
behandlung sowie der Laufzeit für die durch neue Geschwindigkeitprofile
zusätzlich generierten Besuche. Die beiden letzteren Teile werden durch die
spezifische Konstruktion des Worst-Case-Szenarios für jede Trajektorie aus
T für alle Planungspunkte erneut durchgeführt.
Betrachtet man die algorithmische Komplexität, dann kann die Laufzeit in
O-Notation als O( n m ) dargestellt werden, sie wächst also nicht wesentlich
schneller als eine lineare Funktion bezüglich der Eingabegrößen n (Anzahl
Planungspunkte von T) und m (Anzahl bereits existierender Trajektorien in
T ).
Diskussion des iterativen Verfahrens
Die Best Cases und die Worst Cases für Durchlaufzeit und Laufzeit stehen in
direkter Korrelation zueinander. Eine Trajektorie mit wenig Kollisionen hat
eine kürzere Durchlaufzeit und wird schneller berechnet als eine Trajektorie
mit vielen Kollisionen, die lange Wartezeiten hat. Dieser Umstand wird
im folgenden Abschnitt für die Entwicklung eines verbesserten Verfahrens
verwendet.
Das Worst-Case-Szenario lässt sich mit einer einspurigen Straße verglei-
chen, die keine Ausweichmöglichkeit bietet und in beide Richtungen befah-
5.6 Kollisionsfreie Bewegung mehrerer Objekte 141
ren werden kann. Es handelt sich in gewisser Weise um einen degenerierten
Fall, da es keine freie Verteilung der Bahnkurven im logistischen Raum gibt
und sich im Grunde alles in einem eindimensionalen Raum abspielt. Es ist
intuitiv zu erkennen, dass das in Abbildung 5.11 abgebildete Szenario durch
ein einfaches Verschieben der gegenläufigen Bahnkurven leicht zu einem
Best-Case-Szenario ohne jegliche Kollisionen verändert werden kann. Diese
Beobachtung bildet die Grundlage für ein heuristisches Verfahren, das in den
folgenden Abschnitten entwickelt wird.
5.6.1 Das Verfahren als Zustandsautomat
Das iterative Verfahren wird in diesem Abschnitt als Zustandsautomat be-
trachtet, der nicht direkt auf den Planungspunkten des Geschwindigkeits-
profils operiert, sondern als Eingabe ein Zeitintervall erfordert, das zu einer
skalaren Ortsveränderung auf der Bahnkurve führt. Die Darstellung als Zu-
standsautomat hat mehrere Eigenschaften, die sich im weiteren Verlauf der
Arbeit als vorteilhaft auf folgende Punkte auswirken:
• visuelles Verständnis der Kernelemente des Verfahrens
• Einführung einer Metrik für die Laufzeitbestimmung anhand der Anzahl
der besuchten Zustände
• Weiterentwicklung zur Verbesserung der Laufzeit durch ganzheitliche
Betrachtung kollidierender Trajektorien (im Gegensatz zu punktueller
Betrachtung)
• Grundlage für die effiziente (pseudo-)parallele Berechnung mehrerer
kollisionsfreier Trajektorien
In Abbildung 5.12 wird das im vorherigen Abschnitt entwickelte Verfahren
als Zustandsautomat abgebildet. Dessen Struktur besteht aus den Zustän-
den s0, s1, s2, s3, se ∈ S der zu planenden Trajektorie T, der Menge an bereits
existierenden Trajektorien T und dem aktuell betrachteten Zeitpunkt t. Aus
der gegebenen Struktur können die aktuelle Position und die Nachbarschaft
abgeleitet werden, sodass eine Prüfung auf Kollisionen möglich ist. Der Au-
tomat startet in Zustand s0 mit dem Startzeitpunkt der Trajektorie t = t0 am
kollisionsfreien Startort. Das Weiterschalten des Automaten zwischen den
Zuständen s0, s1, s2, s3 und se wird durch ein parametrisiertes Triggerereignis
ausgelöst, das eine Zeitspanne ∆t als Eingabe akzeptiert, die den nächsten
Zeitpunkt tn+1 = tn + ∆t bestimmt. Solange keine Kollision festgestellt wird,
bleibt der Automat in Zustand s1, bis das Ende der Trajektorie erreicht wird.
Sollte eine Kollision eintreten, dann wird in Zustand s2 der Bremspunkt
berechnet und gesetzt und anschließend das Geschwindigkeitsprofil von T
in Zustand s3 neu berechnet sowie t zurückgesetzt. Die Zustandsübergän-
ge s2→ s3 und s3→ s1 werden durch das Ende der jeweiligen Berechnung
ausgelöst.
142 5 Verfahren zur kinodynamischen Bewegungsplanung
Abb. 5.12 Verfahren zur Kollisionsvermeidung als Zustandsautomat
Der obere Teil von Abbildung 5.12 veranschaulicht die Best Cases bezüglich
Durchlaufzeit und algorithmischer Laufzeit des Verfahrens, wenn keine Kol-
lisionen auftreten. Wenn der Automat den Endzustand se erreicht, dann gibt
der Wert von t die Durchlaufzeit an. Bei einer Kollision wird eine Bremsung
und Neuberechnung des Geschwindigkeitsprofils in den Zuständen s2 und
s3 durchgeführt und t zurückgesetzt. Der Parameter ∆tmuss in Abhängig-
keit von vmax so gewählt werden, dass jede Kollision detektiert wird. Dies
bedeutet bei hohen Geschwindigkeiten eine entsprechend feine notwendige
Abtastrate.
Zur Erstellung einer Metrik für die algorithmische Laufzeit des Zustands-
automaten werden die Zustände auf die Operationen aus Abschnitt 5.6
abgebildet. Die Funktion o : S→O gibt die zugeordnete Operation für einen
Zustand zurück. Über die Funktion l :O→R+ kann die spezifische Laufzeit
für eine Operation bestimmt werden. Eine Zählung der besuchten Zustän-
de ergibt die Gesamtlaufzeit. Dabei werden die folgenden Abbildungen
definiert: s0 7→ o1, s1 7→ o2, s2 7→ o3 und s3 7→ o4.
Betrachtet man das angepasste Worst-Case-Szenario in Abbildung 5.13,
dann wird eine zuerst in tc festgestellte Kollision so lange zu neuen Brems-
punkten führen bis der Zeitpunkt tw erreicht wird. Je kleiner ∆t gewählt
wurde, desto häufiger müssen die Zustände s2 und s3 unnötigerweise be-
sucht und damit die teuren Operationen o3 (Bremspunkt berechnen) und o4
(Geschwindigkeitsprofil neu berechnen) durchgeführt werden.
5.6 Kollisionsfreie Bewegung mehrerer Objekte 143
Abb. 5.13 Szenario zur Veranschaulichung der Weiterentwicklung des Verfahrens zur
Kollisionsvermeidung
Zur Vermeidung der unnötigen Neuberechnung wird der Zustandsauto-
mat um zwei Zustände erweitert, die dazu dienen, den gesamten Kolli-
sionsbereich der zwei Trajektorien zu bestimmen, bevor der Bremspunkt
gesetzt wird. Die neue Struktur des Automaten besteht aus den Zuständen
s′ ′ ′ ′ ′ ′ ′ ′0, s1, s2, s3, s4, s5, se ∈ S , der zu planenden Trajektorie T, der Menge an bereits
existierenden Trajektorien T und dem aktuell betrachteten Zeitpunkt t des
Bewegungsobjekts und dem betrachteten Zeitpunkt tcol des Kollisionsob-
jekts.
Abbildung 5.14 zeigt den neuen Zustandsautomaten, der im kollisions-
freien Fall unverändert bleibt. Im Fall einer Kollision ist t = tc und die kolli-
dierende Trajektorie wird mit tcol0 := tc initialisiert. Anschließend wird der
Zustand s′2 so lange besucht und dabei die Bewegung über tn+1 = tn − ∆t
schrittweise rückgängig gemacht, bis eine kollisionsfreie Position auf der
Bahnkurve gefunden wird. Daraufhin geht der Automat in den Zustand s′3
über, der die Vorwärtsbewegung des Kollisionsobjekts auf seiner eigenen Tra-
jektorie TK mit tcoln+1 = t
col
n + ∆t so lange simuliert, bis eine erneute Kollision
auftritt oder die Nachbarschaft von T verlassen wird.
Das Wechselspiel zwischen den Zuständen s′2 und s
′
3 führt zur Verdrän-
gung des Betrachtungsobjekts entlang der Bahnkurve T, bis eine in Bezug
auf TK dauerhaft kollisionsfreie Position erreicht wird, die durch den Zeit-
punkt tw gekennzeichnet ist. Der Zeitpunkt t f kennzeichnet den Ort auf der
Kollisionstrajektorie TK, an dem die Nachbarschaft von T verlassen wird.
Die zwei neu eingefügten Zustände bilden in Bezug auf die Laufzeit fol-
genden Operationen ab: s′2 7→ o2 und s′3 7→ o2. Damit müssen die aufwändigen
Operation o3 und o4 für jeden zusammenhängenden Konfliktbereich nur ein
einziges Mal durchgeführt werden.
Die Wartezeit ∆tw am Bremspunkt, der durch den Zeitpunkt tw gekenn-
zeichnet ist, kann durch ∆tw = t f − tc bestimmt werden. Dieser wird in
Zustand s′ ′4 gesetzt und anschließend wird in s5 ein neues Geschwindigkeits-
144 5 Verfahren zur kinodynamischen Bewegungsplanung
profil erstellt, das zum Zeitpunkt tw so lange die Bewegung verzögert, bis
das Kollisionsobjekt auf TK den gemeinsamen Konfliktbereich verlassen hat.
Abb. 5.14 Zustandsautomat für das weiterentwickelte Verfahren zur
Kollisionsvermeidung
Die Modellierung des Verfahrens als Zustandsautomat erlaubt eine schritt-
weise Ausführung über die parametrisierte Triggerfunktion adv’. Über diese
Funktion werden die Zustandsübergänge von s′ bis s′0 4 ausgelöst sowie der
Übergang von s′1 zum Endzustand s
′
e. Die beiden Übergänge von s′ ′4 zu s5 und
von s′5 zu s
′
1 werden automatisch durch das Ende der jeweiligen Operationen
ausgeführt. Ein Nachweis über die Terminiertheit des Zustandsautomaten,
also die Garantie, dass bei jeder Eingabe nach einer endlichen Folge von Trig-
gerereignissen der Zustand s′e erreicht wird, kann analog zur Argumentation
in Abschnitt 5.6 erfolgen. Über diese Architektur lassen sich mehrere Trajek-
torien schrittweise pseudoparallel zur Kollisionsfreiheit transformieren, was
im folgenden Abschnitt verwendet wird.
5.6 Kollisionsfreie Bewegung mehrerer Objekte 145
5.6.2 Heuristische Verbesserung
Wie die konstruierten Worst-Case-Szenarien in Abbildung 5.11 und Abbil-
dung 5.13 veranschaulichen, bedarf es in vielen Konfliktfällen einer Ver-
schiebung der Bahnkurven im logistischen Raum, damit eine konfliktfreie
Bewegung möglich wird. Aus dieser Betrachtung heraus soll die heuristische
Annahme getroffen werden, dass durch konfliktfreie Berechnung einer Mehr-
zahl von homotopen Trajektorien in vielen Fällen eine Trajektorie gefunden
werden kann, die wenige oder gar keine Konflikte erzeugt.
Abb. 5.15 Trajektorien auf der Basis homotoper Bahnkurven zwischen q und s (Screenshot
des entwickelten Simulationswerkzeugs)
Abbildung 5.15 zeigt homotope Bahnkurven im freien logistischen Raum,
die Quelle qmit Senke s verbinden. Die Bahnkurven orientieren sich an der
optimalen Bahnkurve mit der kürzesten Durchlaufzeit für ein einzelnes Ob-
jekt. Ziel ist die Suche nach einer Lösungstrajektorie mit wenigen Konflikten,
die nur geringe Abweichungen von der optimalen Bahnkurve hat.
Algorithmus 8 zeigt den Pseudocode für die Berechnung der Trajektorie
mit der kürzesten Durchlaufzeit. Er erwartet als Eingabe eine Liste von Kan-
didatentrajektorien K , die gegen die Menge der existierenden Trajektorien
T getestet werden. Zusätzlich wird mit ∆t der Zeitraum angegeben, der
den inkrementellen Fortschritt der Zustandsautomatensimulation bestimmt
und der von der Maximalgeschwindigkeit der bewegten Objekte abhängt.
Die Ausgabe ist diejenige kollisionsfreie Trajektorie, deren Geschwindig-
keitsprofil die kürzeste Durchlaufzeit aller Kandidaten hat. Bei mehreren
gleichwertigen Lösungen wird die zuerst gefundene ausgegeben.
In den Zeilen 1 bis 5 wird für jeden Kandidaten ein Zustandsautomat initiali-
siert. Anschließend werden in einer Endlosschleife alle Zustandsautomaten
über die Funktion adv’ mit dem Zeitraum ∆t weitergeschaltet (siehe Zeile
9). Wenn ein Zustandsautomat den Endzustand s′e erreicht, wird der Algo-
146 5 Verfahren zur kinodynamischen Bewegungsplanung
Algorithmus 8 Berechnung der Trajektorie mit der kürzesten Durchlaufzeit
Eingabe: Liste der Kandidatentrajektorien K , Menge der existierenden Trajektorien T ,
Schrittweite der Simulation ∆t
Ausgabe: Zeitoptimale, kollisionsfreie Trajektorie Tresult
1: for i = 0 to i < |K | do
2: statei← s′0
3: timei← 0
4: coltimei← 0
5: end for
6:
7: loop
8: for i = 0 to i < |K | do
9: Ki, statei, timei, coltimei← adv’(∆t,Ki,T , statei, timei, coltimei)
10: if state ′i = se then
11: Tresult←Ki
12: return Tresult
13: end if
14: end for
15: end loop
rithmus mit der gefundenen kollisionsfreien Trajektorie als Rückgabewert
beendet. Die Terminiertheit jedes einzelnen Zustandsautomaten garantiert,
dass in endlicher Zeit ein Automat den Endzustand s′e erreicht und somit die
Endlosschleife verlassen wird. Damit ist die Terminiertheit von Algorithmus
8 gegeben.
Durch das sequenzielle, schrittweise Weiterschalten mehrerer Zustands-
automaten wird ein Round Robin Scheduling umgesetzt. Jeder Zustands-
automat erhält die begrenzte Zeitscheibe ∆t, für deren Simulation er die
Berechnungen durchführt. Dies führt dazu, dass die Berechnung für die
Kandidatentrajektorie mit der kürzesten Durchlaufzeit zuerst fertiggestellt
wird und alle anderen Berechnungen abgebrochen werden können.
Der Erfolg der Heuristik hängt wesentlich von der Generierung der Kan-
didatentrajektorien ab. Je mehr Kandidaten berücksichtigt werden, desto
wahrscheinlicher ist das Auffinden einer Trajektorie mit wenigen Kollisionen.
Mit einer steigenden Anzahl erhöht sich jedoch der Berechnungsaufwand
innerhalb eines Durchlaufs der Endlosschleife.
Kapitel 6
Evaluation
Zusammenfassung Das sechste Kapitel widmet sich der empirischen und
simulativen Evaluation des entwickelten Verfahrens. Zunächst wird die Ar-
chitektur der physischen Testbedumgebung beschrieben, die eine Evaluati-
on nach dem Konzept des Cyberphysischen Zwillings ermöglicht und die
Schnittstelle zwischen Empirie und Simulation bildet. Anschließend wer-
den die kinodynamischen Grenzwerte eines einzelnen realen Roboters, des
Loadrunners, bestimmt. Die nachfolgenden Abschnitte befassen sich mit
einer Simulationsstudie, mit der die Leistung eines Loadrunner-Systems bei
der Sortierung von Paketen untersucht wird. Es zeigt sich, dass ein solches
System die Leistung eines klassischen Sortiersystems mit Stetigfördertechnik
deutlich übertreffen kann. Das Kapitel schließt mit einer kritischen Reflexion
der in der Einleitung aufgestellten Hypothesen.
147
148 6 Evaluation
Die Evaluation des entwickelten Verfahrens zur Bewegungsplanung gliedert
sich in einen empirischen und einen simulativen Teil. Im empirischen Teil
werden die kinodynamischen Grenzwerte eines einzelnen realen Roboters
untersucht, der auf Basis der splinebasierten Bewegungsplanung gesteuert
wird. Das Ziel ist die Bestimmung einer maximalen Beschleunigung, mit
der für beliebige Trajektorien die dazugehörigen Geschwindigkeitsprofile so
berechnet werden, dass der Roboter sie physisch befahren kann.
Kernelement der empirischen Phase ist ein Testbed für die Entwicklung
Cyberphysischer Zwillinge. Es besteht aus einer freien Versuchsfläche, die
den idealen logistischen Raum darstellt, einem System zur kontinuierli-
chen Beobachtung aller Objekte und einem Simulations- und Steuerungspro-
gramm zur virtuellen Abbildung des Verhaltens des physischen Roboters.
Sowohl Simulationsprogramm als auch Roboter verwenden das gleiche Ver-
fahren zur Bewegungsplanung, sodass eine simulierte Bewegung anhand
der kontinuierlichen Beobachtungen validiert werden kann. Dazu werden
die Beobachtungsereignisse laufend an die Simulation übertragen.
Das Ziel der simulativen Evaluationsphase ist die Bestimmung der Leis-
tung einer großen Zahl von Transportrobotern in einem logistischen An-
wedungsszenario. Dazu wird das Simulationsprogramm des Testbeds ver-
wendet, sodass die individuellen Bewegungen der simulierten Roboter dem
validierten Verhalten des realen Roboters gleichen. Die validierte Grenzbe-
schleunigung aus der empirischen Phase sichert die Bewegungsplanung der
simulativen Phase auch für eine größere Anzahl an simulierten Robotern, da
der Grundcharakter der Trajektorienplanung unverändert bleibt.
6.1 Testbed für die Entwicklung Cyberphysischer
Zwillinge
Als Testbed für die empirische Evaluation dient das Innovationslabor Hybride
Dienstleistungen in der Logistik, das vom Lehrstuhl für Förder- und Lager-
wesen FLW der Technischen Universität Dortmund gemeinsam mit dem
Fraunhofer-Institut für Materialfluss und Logistik IML betrieben wird. Sei-
ne Multisensor-Referenzumgebung ermöglicht den physischen Nachbau
logistischer Szenarien [Zei+17]. Innerhalb des Labors wird eine Fläche von
22m× 15m× 4m durch ein Motion-Capturing-System (MoCap-System) be-
obachtet.
Das Labor befindet sich in einer Leichtbauhalle, die baugleich mit her-
kömmlichen Industriegebäuden im Logistikbereich ist, und folgt dem Grund-
konzept einer hochflexiblen Entwicklungsumgebung, deren Versuchsfläche
frei von fest installierten Gewerken bleibt. Diese Versuchsfläche wird wäh-
rend der emiprischen Evaluation als physisches Abbild des idealen logisti-
schen Raums verwendet.
6.1 Testbed für die Entwicklung Cyberphysischer Zwillinge 149
Die Halle ist mit mehreren Beobachtungssystemen ausgestattet, die an
der Decke, an den Wänden und im Boden installiert sind. Im Rahmen der
empirischen Evaluation wird ausschließlich das MoCap-System verwen-
det. Es besteht aus 50 Infrarotkameras des Herstellers Vicon und kann eine
große Zahl von retroreflektiv markierten Objekten verfolgen. Es liefert Lo-
kalisierungsdaten mit einer Genauigkeit von 0,3mm und arbeitet mit einer
Datenübertragungsrate von bis zu 300Hz. Die Lokalisierungsdaten sind über
das Netzwerk für mehrere Empfänger gleichzeitig zugänglich und liefern die
Position und Rotation der markierten Objekte im dreidimensionalen Raum.
Neben einfachen physischen Objekten stehen mehrere Marker-Anzüge zur
Personenortung zur Verfügung, deren Daten als komplexe, digitale Skelett-
modelle bereitgestellt werden.
Abb. 6.1 Gesamtansicht des Testbeds während des Betriebs3
Abbildung 6.1 zeigt eine exemplarische Nutzung des Testbeds. Die Person,
der Roboter und der Behälter werden vom MoCap-System beobachtet. Acht
Laserprojektoren decken den Versuchsraum ab und können farbige Vektor-
grafiken auf den Boden projizieren. Im Vordergrund projiziert das Lasersys-
3 Quelle:©c Fraunhofer-Institut für Materialfluss und Logistik / Michael Neuhaus
150 6 Evaluation
tem eine visuelle Darstellung der aktuellen internen Datenstrukturen der
Robotersteuerung.
Architektur der Entwicklungsumgebung
Die Architektur der Entwicklungsumgebung basiert auf dem Konzept des
Cyberphysischen Zwillings. Abbildung 6.2 zeigt schematisch das Zusam-
menspiel der Infrastruktur. Alle markierten Objekte, die sich auf der Ver-
suchsfläche befinden, werden über ein MoCap-System lokalisiert und über
eine Netzwerkverbindung in die Simulationsumgebung übertragen und dort
abgebildet. Neben der Abbildung physischer Objekte kann die Simulation be-
liebig viele rein virtuelle Objekte enthalten, die (noch) keine Repräsentation
im physischen Raum besitzen.
Simulationsumgebung
virtuelle Objekte physische Repräsentation
virtueller Raum
Laserprojektion MoCap-System
nicht markierte 
Objekte passiv Mensch Roboter
markierte Objekte
idealer logistischer Raum (physische Versuchsfläche)
Abb. 6.2 Architektur der Entwicklungsumgebung des Testbeds
Zu Beginn der Entwicklung befindet sich die gesamte übergeordnete Steue-
rungslogik zentral in der Simulationsumgebung, die einfache Bewegungs-
anweisungen an die Robotersysteme sendet und resultierende Objektbe-
wegungen über die MoCap-Verbindung erhält. Virtuelle Objekte, die keine
physische Repräsentation haben, werden über das Laserprojektionssystem
auf dem Hallenboden gespiegelt. Wenn keine physischen Objekte gesteu-
ert werden, dann können die virtuellen Roboter- und Objektbewegungen
zeitlich beschleunigt simuliert werden.
In späteren Entwicklungsphasen wird die übergeordnete Steuerungslo-
gik schrittweise dezentralisiert und von der Simulationsumgebung auf die
physischen Roboter übertragen. Dies geschieht manuell durch Neuimplemen-
tierung in der Programmiersprache des Zielsystems. Als Beispiel verwendet
das aktuelle System C# in der Simulation sowie Python und C++ innerhalb
einer Robotersteuerung.
6.2 Empirische Evaluation 151
6.2 Empirische Evaluation
Für die empirische Evaluation wird ein Transportroboter verwendet, der
gemeinsam von Forschern des Lehrstuhls FLW und des Fraunhofer IML
entwickelt wurde. Die Feldversuche im Testbed weisen nach, dass mit dem
sogenannten Loadrunner ein Roboter existiert, der die geplanten Trajektorien
und Geschwindigkeitsprofile des in dieser Arbeit entwickelten Verfahrens
sicher fahren kann.
Beschreibung des Loadrunners
Der Loadrunner ist ein Transportroboter, der als Hardwareplattform in ver-
schiedenen Konfigurationen für unterschiedliche logistische Anwendungen
konzipiert ist. Ein Ziel bei der Entwicklung des Roboters waren Geschwindig-
keit und Beschleunigung, die deutlich höher als bei existierenden Robotern
oder Fahrerlosen Transportfahrzeugen in der Logistik sind. Ein weiteres
Ziel war die Unterstützung von Verfahren zur Bewegungsplanung für eine
große Anzahl von Robotern. Dies soll durch einen möglichst hohen Grad
an Manövrierfähigkeit gewährleistet werden. Dazu wurde der Loadrunner
als holonomischer Roboter entworfen. Er kann sich daher omnidirektional
bewegen und seine Rotation ist unabhängig von der Fahrtrichtung. Dies
wird durch Einsatz von Allseitenrollen erreicht, in diesem Fall sogenannte
Omniwheels.
Abb. 6.3 Designstudie des Loadrunners4
Abbildung 6.3 zeigt Unter- und Oberseite des Loadrunners in seiner Kon-
figuration als Transportroboter für Pakete. Mit vier Direktantrieben über
getriebelose Asynchronmotoren und einer Leistung von jeweils 3,6kW kön-
nen theoretisch Geschwindigkeiten von über 30m/s erreicht werden. Bei
einer Höhe von 14cm und einem Durchmesser von 55cm hat die Plattform ei-
ne Nutzlast von 30kg. Dies ermöglicht zahlreiche Anwendungen im Bereich
der Intralogistik. Je nach Einsatzszenario kann die Plattform mit unterschied-
lichen Lastaufnahmemitteln ausgestattet werden.
4 Quelle:©c Fraunhofer-Institut für Materialfluss und Logistik
152 6 Evaluation
Parallele Entwicklung und Evaluation
Die Entwicklung des Loadrunners erfolgte nach dem Konzept des Cyber-
physischen Zwillings. Dementsprechend wurde die Simulationsumgebung
des Testbeds parallel zum physischen Roboter entwickelt. Abbildung 6.4
zeigt die virtuelle Abbildung der Versuchsfläche mit 3D-Modellen mehrerer
Loadrunner. Das in dieser Arbeit beschriebene Verfahren zur splinebasierten
Trajektorienplanung mit Geschwindigkeitsprofil wurde für die Simulati-
onsumgebung und den Loadrunner gleichzeitig programmiert. Über die
Datenanbindung des MoCap-Systems können die berechneten Trajektorien
mit dem tatsächlichen Fahrverhalten abgeglichen werden.
Abb. 6.4 Simulationsumgebung für die Entwicklung und Evaluation des Loadrunners
Über einen iterativen Entwicklungsprozess wurde das Verhalten der Simulati-
on und des physischen Roboters soweit angeglichen, bis eine praxistaugliche
Übereinstimmung erreicht wurde.
Über eine Benutzeroberfläche kann eine manuelle Bewegungsplanung
durchgeführt werden, bei der die Kontrollpunkte der Splines einzeln gesetzt
und verändert sowie erlaubte Beschleunigungen und Höchstgeschwindig-
keiten für das Geschwindigkeitsprofil vorgegeben werden. Diese manuellen
Trajektorien werden an die Loadrunner übertragen, die versuchen, die so
geplante Bewegung durchzuführen.
Für die empirische Evaluation wurde die Bewegungsplanung für ein Pa-
ketsortierszenario auf der Versuchsfläche mit acht Loadrunnern manuell in
der Simulation durchgeführt. Dabei wurde schrittweise die maximale Be-
schleunigung und Geschwindigkeit so weit erhöht, bis die kinodynamischen
Grenzwerte des Loadrunners erreicht wurden.
6.3 Simulationsstudie 153
Ergebnisse
Die empirische Untersuchung ergibt, dass der Loadrunner jegliche splineba-
sierte Bahnkurve mit einem Geschwindigkeitsprofil der Bewegungsplanung
unter folgenden kinodynamischen Zwangsbedingungen mit einer sehr ge-
ringen Abweichung befahren kann:
• Beschleunigung
Der Loadrunner kann sicher alle Bahnkurven mit Geschwindigkeitsprofil
fahren, die mit einer maximalen Beschleunigung von 4m/s2 berech-
net werden. Es ist aus den praktischen Versuchen plausibel, dass eine
Beschleunigung von 5m/s2 durch technische Verbesserungen erreicht
werden kann.
• Geschwindigkeit
Aufgrund der beschränkten Ausmaße des Testbeds konnte eine Höchst-
geschwindigkeit von 12m/s in der Praxis getestet werden. Höheren
Geschwindigkeiten steht prinzipiell nichts entgegen, bis auf eine mecha-
nisch bedingte Grenzgeschwindigkeit des Loadrunners selbst und die
Fähigkeit zur Lokalisierung bei hohen Geschwindigkeiten. Aus den prak-
tischen Versuchen erscheint eine Geschwindigkeit von 25m/s plausibel
erreichbar, wenn genug Platz vorhanden ist.
Mit der empirischen Untersuchung können die kinodynamischen Zwangs-
bdingungen als Grundlage für eine Simulationsstudie verwendet werden,
die eine Leistungsbestimmung für Systeme mit einer großen Anzahl an
Loadrunnern ermöglicht.
6.3 Simulationsstudie
Mit der Simulationsstudie soll die Hypothese H5 belegt werden, nach der ein
Hochleistungssortiersystem mit klassischer Stetigfördertechnik durch einen
Schwarm hochdynamischer Transportroboter ersetzt werden kann (vgl. Ab-
schnitt 1.3). Dazu wird als Szenario ein Paketsortiersystemmit Loop-Struktur
verwendet, für das eine klassische Leistungsberechnung existiert (vgl. Ab-
schnitt 2.1). Es wird anschließend ein Simulationsmodell eingeführt, das die
gleichen Ein- und Ausgangspunkte für Pakete wie das herkömmliche Sortier-
system besitzt, jedoch anstelle der Stetigfördertechnik einen Schwarm von
Loadrunner-Fahrzeugen zum Transport einsetzt. Zur Bewegungsplanung
wird der Algorithmus aus Kapitel 5 verwendet.
Die zu beantwortende Fragestellung ist, ob durch die Simulation der
Loadrunnerbewegungen eine vergleichbare Leistung in Anzahl Paketen pro
Stunde wie bei einem herkömmlichen Hochleistungssortiersystem nachge-
wiesen werden kann. Wenn dies der Fall ist, dann ist eine zweite Fragestel-
lung, mit welcher Anzahl an Loadrunner-Fahrzeugen die gleiche Leistung
154 6 Evaluation
erreicht wird und bei welcher Anzahl an Fahrzeugen eine Grenzleistung
erreicht wird.
Szenario Hochleistungssorter im Paketzentrum
Als Szenario für die Simulationsstudie wird auf die Arbeit von Kai Semrau
zur analytischen Leistungsermittlung von Stückgutsortiersystemen zurück-
gegriffen (vgl. [Sem15]). Seine analytischen Berechnungsmethoden wurden
durch eine Simulation validiert, bei der ein Sorter mit Loopstruktur ver-
wendet und die Plausibilität der Formeln anhand der Simulationsergebnisse
nachgewiesen wird (vgl. [Sem15] S. 99ff). Dieses Modell wird genutzt, um die
Leistungsfähigkeit der Bewegungsplanung des Loadrunners mit einem her-
kömmlichen Sorter zu vergleichen. Durch die Verwendung der validierten
analytischen Berechnungsmethoden von Semrau ist eine erneute Simulation
des herkömmlichen Systems nicht erforderlich.
Ausschleusbereich
...
...
Ausschleusbereich
Abb. 6.5 Loop-Sorter mit einem Einschleusbereich
Abbildung 6.5 zeigt das Schema eines Loop-Sorters mit einem Einschleus-
bereich und einem Ausschleusbereich, dessen Endstellen sich auf die zwei
Längsseiten der Fläche verteilen. Der Verteilförderer verbindet die Bereiche
und bildet den Kern des Sortiersystems.
Leistungsbestimmung eines stetigen Verteilförderers
Die Berechnung der Nennleistung eines stetigen Verteilföderers erfolgt nach
Semrau (vgl. [Sem15] S. 15, Formel 2.1). Er verwendet typische in der Realität
vorkommende Parameter für die Geschwindigkeit und die Aufteilung des
Tragmittels. So ergibt sich folgende Nennleistung:
vv 2m/sPNenn = c · = 1 · = 9000 Stk./h (6.1)e 0,8m
Einschleusbereich
6.3 Simulationsstudie 155
Bemerkenswert ist, dass die Nennleistung des Verteilförderers ausschließ-
lich von seiner Geschwindigkeit vv, der Teilung e und der Anzahl paralleler
Tragmittel c abhängig ist. Die Größe der Fläche und die Anzahl an Aus-
schleusungen haben keinen Einfluss auf die Leistung. Wenn die Leistung
der Einschleusungen gewährleistet, dass zu jeder Zeit alle Plätze auf dem
Verteilförderer belegt werden, dann entspricht die Gesamtleistung der Nenn-
leistung mit
Pges = PNenn. (6.2)
Da alle Pakete während eines Umlaufs an den Endstellen abgegeben werden,
sind die Plätze auf dem Verteilförderer vollständig frei, wenn sie wieder am
Einschleusbereich eintreffen. Solange die Einschleustechnik in der Lage ist,
ein Paket sicher auf einen freien Platz zu bewegen, gibt es keine Konfliktsi-
tuationen im Sinne einer Bewegungssteuerung.
A2
...
E1 E2
...
A1
Abb. 6.6 Loop-Sorter mit zwei Einschleusbereichen (E1, E2) und zwei
Ausschleusbereichen (A1, A2)
Dies ändert sich, wenn mehrere abwechselnde Ein- und Ausschleusbereiche
eingeführt werden, wie Abbildung 6.6 am Beispiel von zwei Einschleusberei-
chen zeigt. In diesem Fall entstehen Konfliktsituationen immer dann, wenn
ein Paket an einem anderen Einschleusbereich vorbeifährt, um sein Ziel zu
erreichen. Der Platz ist belegt und kann zu diesem Zeitpunkt nicht von der
betroffenen Einschleusung genutzt werden. Dies führt zu einer Leistungs-
minderung in Bezug auf die dortige Einschleusleistung.
Die Gesamtleistung eines Loop-Sorters mit zwei Einschleusungen wird
von der Anzahl an Paketen beeinflusst, die ein Blockieren von Plätzen an
der nächsten Einschleusung verursachen, an der sie auf demWeg zum Ziel
vorbeifahren müssen. Die Parameter p12 und p21 bezeichnen den jeweiligen
Anteil an Paketen, deren Quelle-Senke-Relation einen solchen blockierenden
Weg vorgibt. Dabei folgt die Benennung der Parameter dem Muster pEA mit
156 6 Evaluation
E als Nummer des Einschleusbereichs und A als Nummer des Ausschleusbe-
reichs. Bei einer Gleichverteilung auf die Endstellen gilt p12 = p21 = 0,5. Auf
dieser Basis kann die Gesamtleistung für das erweiterte Szenario wie folgt
bestimmt werden (vgl. [Sem15] S. 37, Formel 3.18):
2− p − p 2− 0,5− 0,5
Pges = P
12 21
Nenn · 1− p12 ·
= 9000 ·
p21 1− ·
= 12000 Stk./h (6.3)
0,5 0,5
Eine Verdoppelung der Einschleusbereiche führt also nicht zu einer Verdop-
pelung der Gesamtleistung. Die Erhöhung der Leistung beschränkt sich auf
die Pakete, die an einem Einschleusbereich erfolgreich einen freien Platz
bekommen und vor dem nächsten Einschleusbereich den Verteilförderer
wieder verlassen. Bei einer Gleichverteilung der Ziele ergibt sich ein Leis-
tungszuwachs von 30 Prozent.
Die Einfachheit der analytischen Berechnungsmethode für den Verteil-
förderer wird durch die Reduktion der Dimensionalität des Raums erreicht.
Der Konfigurationsraum der Loopstruktur ist im Grunde mit einem Band
vergleichbar, das durch den physischen Raum gelegt wird und dessen Enden
miteinander verbunden sind. Dies entspricht einer 1D-Mannigfaltigkeit, die
das Bewegungsplanungsproblem trivial lösbar macht. Es gibt immer genau
einen Weg, den ein Paket von der Quelle zur Senke befahren kann. Durch die
gleichmäßige Geschwindigkeit des Förderers entfällt die Betrachtung der ki-
nodynamischen Rahmenbedingungen. Das Problem der Konflikte zwischen
Bewegungsvorgängen konzentriert sich ausschließlich auf den Einschleusvor-
gang. Wenn ein Paket einmal auf dem Förderer liegt, dann kommt es sicher
an der Senke an und wird dort ausgeschleust. Damit kann die technische
Wahrnehmungsfähigkeit gezielt auf Ein- und Ausschleuspunkte reduziert
werden und muss nicht kontinuierlich erfolgen (durch Barcodescanner und
Lichtschranken). Diese Vorteile werden durch die umfangreiche statische
Infrastruktur erkauft, die beim Aufbau des Systems erforderlich ist. Die me-
chanischen Zwangsbedingungen, die den sicheren Transport der Pakete ohne
kontinuierliche Beobachtung und Regelung ermöglichen, sind gleichzeitig
die Ursache der fehlenden Flexibilität und schwachen Wandelbarkeit des
Systems.
Sortierung auf Basis des Loadrunners
Die Verwendung des Loadrunners zur Paketsortierung ersetzt die stetig
fördernde Loopstruktur durch einen Schwarm unstetig fördernder Transpor-
troboter. Wie in Abbildung 6.7 zu sehen ist, bleiben die Ein- und Ausschleus-
bereiche des Systems an der gleichen Position. Die Einschleusungen werden
durch Abholstationen ersetzt, an denen die Loadrunner Pakete aufnehmen
und anschließend zum Zielort bringen. Damit verändert sich der Konfigu-
rationsraum für die Bewegungsplanung zu einer 2D-Mannigfaltigkeit, und
6.3 Simulationsstudie 157
Konflikte werden auf der gesamten zur Verfügung stehenden Fläche gelöst.
Durch die Komplexität der Bewegungsplanung im freien Raum ist keine
einfache analytische Berechnung der Leistungsfähigkeit möglich, sondern
es bedarf einer Simulation des Sortiervorgangs, die das Verfahren der Bewe-
gungsplanung beinhaltet.
A
...
Lastfahrt Leerfahrt
E E
idealer logistischer Raum
...
A
Abb. 6.7 Loadrunner-Sortiersystem auf Basis des idealen logistischen Raums
Der größte Unterschied ergibt sich durch die Unstetigkeit des Loadrunner-
Systems. Die Bewegung eines Loadrunners ist eine sich abwechselnde Abfol-
ge von Leerfahrten zur Lastaufnahme und Lastfahrten zur Lastabgabe (vgl.
Abbildung 6.7). Konflikte können prinzipiell nur dann entstehen, wenn sich
die Wege zweier Quelle-Senke-Relationen kreuzen. Damit ergibt sich eine
Leistungssteigerung durch direkte kurze Wege von der Quelle zur Senke
durch die Vermeidung unnötiger Konflikte. Leistungsmindernd sind die
notwendigen Leerfahrten nach Lastabgabe.
Zielvorgabe für die Leistung und Szenario
Als Zielvorgabe für die zu erreichende Leistung werden 12000 Stk./h ange-
setzt. Dieser Wert entspricht einer typischen Leistung für einen Loop-Sorter
mit zwei Einschleusbereichen. Diese Zielleistung basiert zum einen auf dem
Beispiel von Kai Semrau, zum anderen wurde sie von Logistikexperten des
Fraunhofer IML und aus der Industrie als realitätsnah bestätigt.
Architektur der Simulation
Die Architektur der Simulation baut auf dem Konzept des Cyberphysischen
Zwillings auf und verwendet für die Bewegungsplanung dieselben Algo-
rithmen, die innerhalb des realen Loadrunners zum Einsatz kommen. Im
Gegensatz zu klassischen Simulationswerkzeugen der Logistik, die für ei-
nen globalen Zeitschritt die Ereignisse aller Objekte gleichzeitig berechnen,
158 6 Evaluation
wird der inhärent abgebildete Zeitfortschritt der Geschwindigkeitsprofile
einzelner Loadrunner als Grundlage verwendet.
Die zentrale Datenstruktur der Simulation ist die nach Startzeitpunkten
geordnete Liste der Geschwindigkeitsprofile. Darauf aufbauend werden die
Prozesse des Sortiervorgangs durch geeignete Trajektorien abgebildet. Der
Zeitfortschritt der Simulation orientiert sich an den Geschwindigkeitsprofilen
der Bewegungsplanung. Das jeweils nächste Ereignis, das im Sinne einer
ereignisdiskreten Simulation bearbeitet wird, ist die Ankunft eines Loadrun-
ners an der Endposition seiner aktuell befahrenen Trajektorie. Die Simulation
läuft in folgenden Schritten ab:
• Initialisiere: Zu Beginn der Simulation werden alle Loadrunner gleich-
mäßig auf die Warteschlangen der Einschleusungen (Quellen) verteilt.
• Wiederhole: Falls sich Loadrunner in den Warteschlangen befinden, pla-
ne für den ersten Loadrunner einer der Warteschlangen eine neue Tra-
jektorie mit Geschwindigkeitsprofil, die aus Lastfahrt zur Senke und
anschließender Leerfahrt zu einer Warteschlange besteht.
DieWarteschlangen für die Loadrunner sind sichere Start- und Zielpunkte im
Sinne der Bewegungsplanung und führen zu einer Deadlock- und Livelock-
Freiheit des Systems. Ihre Kapazität kw wird über die Anzahl Loadrunner nlr
und die Anzahl Einschleusungen ne mit kw = nlr/ne berechnet. Bei der Pla-
nung einer neuen Trajektorie wird eine zufällige Senke als Zielpunkt für die
Lastfahrt festgelegt und die diesem nach euklidischer Distanz nächste Warte-
schlange mit freier Kapazität gewählt. Damit verteilen sich die Loadrunner
im Verlauf der Simulation gleichmäßig auf die Quellen.
Die Warteschlangen für Pakete werden in dieser Arbeit als unbeschränkt
angesehen und die Ziele werden gleichverteilt zufällig generiert. Es ist immer
ein Paket vorhanden, wenn ein Loadrunner eine neue Trajektorie plant. Die
Berechnung der Bewegungsplanung kostet in der Simulation keine Zeit, es
wird davon ausgegangen, dass die Berechnung schon zu dem Zeitpunkt
abgeschlossen ist, an dem ein Loadrunner ein Paket übernimmt. Das ist
eine Abstraktion, die in der Simulation zur Vereinfachung angenommen
wird, aber in der Praxis durchführbar ist. Voraussetzung ist, dass ein Paket
rechtzeitig an der Einschleusung identifiziert wird, noch bevor der Trans-
port beginnt. Dies wird durch das entwickelte Verfahren ermöglicht, dessen
Bewegungsplanung auf Basis einer Heuristik schnell zu berechnen ist.
6.3.1 Versuchsdurchführung
Die Versuche werden für ein Basisszenario und ein erweitertes Szenario mehr-
fach mit unterschiedlichen Parametern durchgeführt, um einen Eindruck
vom Einfluss auf die Leistungsfähigkeit zu gewinnen. Die Versuchsdurch-
führung berücksichtigt folgende Aspekte:
6.3 Simulationsstudie 159
• Bestimmung der Leistung ohne Kollision
Für die Bestimmung der Leistung ohne Kollision bewegen sich die
Loadrunner ohne Kollisionsvermeidung. Sie fahren im Konfliktfall durch-
einander durch. Die so ermittelte Leistung stellt eine obere Grenze für
die theoretisch mögliche Leistung in einem gegebenen Szenario dar.
• Bestimmung der Leistung mit Kollisionsvermeidung
In diesem Fall bremsen die Loadrunner, um eine Kollision zu vermeiden,
oder sie verwenden einen alternativen Weg. Die Grenzleistung ist gegen-
über der Leistung ohne Kollision vermindert. Die Grenzleistung wird
erreicht, wenn so viele Loadrunner im System sind, dass kein Leistungs-
zuwachs mehr möglich ist, da zu viele Konflikte erzeugt werden.
• Variation des Sicherheitsabstands
In der empirischen Evaluation wurde nachgewiesen, dass der Loadrun-
ner so genau fährt, dass die Bewegungsplanung mit einem Durchmesser
von 60cm erfolgreich durchgeführt werden kann. Bei einer angenomme-
nen geringeren Genauigkeit in großen Systemen kannmit einer Erhöhung
des Sicherheistabstands auf 80cm gearbeitet werden.
Die Versuche werden für beide Szenarien jeweils mit einer maximalen Be-
schleunigung von 4m/s und 5m/s durchgeführt, um die aktuell erreichbare
Leistung sowie die plausibel erwartbare Leistung zu bestimmen.
Die Versuche werden mit einer ansteigenden Anzahl von Loadrunnern
durchgeführt. Der erste Versuch wird mit 10 Loadrunnern durchgeführt.
In nachfolgenden Läufen wird die Anzahl jeweils um jeweils 10 weitere
Loadrunner erhöht, bis die Anzahl von 100 Loadrunnern erreicht wird.
Basisszenario
Das Basisszenario ist ein direkter Leistungsvergleich zwischen einem Loop-
Sorter mit zwei Einschleusbereichen und einen Loadrunner-System (siehe
Abbildung 6.7). Das entsprechende Szenario wird in der Simulation mit 50
Senken und 8 Quellen abgebildet (siehe Abbildung 6.8). Die Senken werden
in zwei Bereiche aufgeteilt, sodass 25 Senken an der oberen Seite der Grund-
fläche und 25 an der unteren Seite positioniert sind. Die Quellen werden an
der linken und der rechten Seite positioniert.
Die Gesamtfläche beträgt 113m × 25m. Die Länge ergibt sich aus der
Anzahl der Senken an einer Längsseite (25), der Breite der Endstelle an einer
Senke von 1,2m, dem Zwischenabstand von 2,8m und einem Offset von
6,5m amAnfang und am Ende. Die Quellen werden mittig an den Stirnseiten
angeordnet und haben einen Zwischenabstand von 4m bei einem Abstand
von 6,5m zu den Längsseiten.
Eine Versuchsreihe beginnt mit einer Anzahl von 10 Loadrunnern, die mit
jedem weiteren Versuchslauf um 10 erhöht wird, bis zu einer Maximalan-
zahl von 100 Loadrunnern. Für jeden Versuch werden 3 Simulationsläu-
160 6 Evaluation
Abb. 6.8 Screenshot des Basisszenarios vor dem Start der Simulation
Abb. 6.9 Screenshot des Basisszenarios mit 100 Loadrunnern während der Simulation
fe mit unterschiedlichem Sicherheitsabstand für die Kollisionsvermeidung
durchgeführt: 80cm,60cm und 0cm. Mit dem letzten Wert wird die Kolli-
sionsvermeidung abgeschaltet. Abbildung 6.9 zeigt einen Screenshot eines
Simulationslauf mit 100 Loadrunnern.
·103
25
20
15
Zielleistung 80cm
10 60cm
00cm
5
0
0 20 40 60 80 100
Anzahl Loadrunner
Abb. 6.10 Leistungswerte des Loadrunners im Basisszenario bei 4m/s2
Abbildung 6.10 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen
Beschleunigung von 4m/s2. Die theoretische Zielleistung ohne Kollisionsbe-
trachtung wird mit 58 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher-
heitsabstand werden 68 Loadrunner benötigt und bei 80cm Durchmesser
steigt die Anzahl auf 70 Loadrunner.
Stk. / h
6.3 Simulationsstudie 161
·103
25
20
15
Zielleistung 80cm
10 60cm
00cm
5
0
0 20 40 60 80 100
Anzahl Loadrunner
Abb. 6.11 Leistungswerte des Loadrunners im Basisszenario bei 5m/s2
Abbildung 6.11 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen
Beschleunigung von 5m/s2. Die theoretische Zielleistung ohne Kollisionsbe-
trachtung wird mit 53 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher-
heitsabstand werden 59 Loadrunner benötigt und bei 80cm Durchmesser
steigt die Anzahl auf 60 Loadrunner.
Erweitertes Szenario
Das erweiterte Szenario verändert das Layout zugunsten des Loadrunner-
Systems, indem es die Quellen gleichmäßig zwischen die Senken verteilt
(siehe Abbildung 6.12). Auf diese Weise werden die Leerfahrten verkürzt,
da der Rückweg an die nächste Stirnseite entfällt. Alle Quellen und Senken
befinden sich an den Längsseiten. Die gleichmäßge Verteilung der Quellen
führt zu einer Gruppierung der Senken. An jeder Längsseite entstehen so 5
Gruppen mit 5 Senken, die durch eine Quelle getrennt werden.
Die Gesamtfläche beträgt 117,2m× 25m. Die Länge ergibt sich aus der
Anzahl der Senken an einer Längsseite (25), der Breite einer Quelle von
1,2m und dem Zwischenabstand von 2,8m. Die 4 Quellen werden zwischen
die Senken verteilt und beanspruchen einen Zwischenabstand von 7,8m.
In Abbildung 6.13 ist ein Screenshot vor Beginn der Simulation zu sehen,
während Abbildung 6.14 die Situation während eines Simulationslaufs mit
100 Loadrunnern zeigt.
Abbildung 6.15 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen
Beschleunigung von 4m/s2. Die theoretische Zielleistung ohne Kollisionsbe-
trachtung wird mit 52 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher-
Stk. / h
162 6 Evaluation
A E A A E A
...
Leerfahrt
Lastfahrt
...
A E A A E A
Abb. 6.12 Layout des erweiterten Szenarios vor dem Start der Simulation
Abb. 6.13 Screenshot des erweiterten Szenarios vor dem Start der Simulation
Abb. 6.14 Screenshot des erweiterten Szenarios mit 100 Loadrunnern während der
Simulation
heitsabstand werden 58 Loadrunner benötigt und bei 80cm Durchmesser
steigt die Anzahl auf 70 Loadrunner.
Abbildung 6.16 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen
Beschleunigung von 5m/s2. Die theoretische Zielleistung ohne Kollisionsbe-
trachtung wird mit 47 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher-
heitsabstand werden 50 Loadrunner benötigt und bei 80cm Durchmesser
steigt die Anzahl auf 57 Loadrunner.
6.3.2 Ergebnisse
Die durchgeführten Versuche ergeben, dass das Loadrunner-Sortiersystem
die Leistung eines klassischen Sortiersystems mit Loopstruktur in allen Sze-
narien nicht nur erreichen, sondern deutlich übertreffen kann. Das Bewe-
gungsplanungsverfahren im idealen logistischen Raum führt zu einer direk-
6.3 Simulationsstudie 163
·103
25
20
15
Zielleistung 80cm
10 60cm
00cm
5
0
0 20 40 60 80 100
Anzahl Loadrunner
Abb. 6.15 Leistungswerte des Loadrunners im erweiterten Szenario bei 4m/s2
·103
25
20
15
Zielleistung 80cm
10 60cm
00cm
5
0
0 20 40 60 80 100
Anzahl Loadrunner
Abb. 6.16 Leistungswerte des Loadrunners im erweiterten Szenario bei 5m/s2
ten Skalierbarkeit der Systemleistung, die über die Anzahl der Fahrzeuge
gesteuert wird.
Es zeigt sich, dass der Einfluss des Layouts über die mittlere Länge der
Leerfahrten den größten Einfluss auf die Systemleistung hat. Damit hängt
die Gesamtleistung unmittelbar von der Anzahl an Senken und den dazuge-
hörigen Endstellen ab, die das System bereitstellen muss. Je mehr Endstellen
es gibt, desto mehr Leistung ist im System rechnerisch möglich und desto
Stk. / h Stk. / h
164 6 Evaluation
mehr Fahrfläche ist vorhanden. Je mehr Fahrfläche vorhanden ist, desto mehr
Fahrzeuge sind einsetzbar und damit umso mehr Leistung möglich. Dies ist
ein grundlegender Unterschied zum stetigen Verteilförderer, dessen Leistung
unabhängig von seiner Länge und der Anzahl an Endstellen ist.
Es kann beobachtet werden, dass die ausschließliche Anordnung der Quel-
len und Senken an den Längsseiten zu deutlich mehr Kollisionen führt, da die
Bewegungsplanung häufiger in Situationen kommt, bei denen Frontalkollisio-
nen vermieden werden müssen. Es enstehen spontan Warteschlangen auf der
Fläche, die sich ungünstig auf die Systemleistung auswirken. Das führt dazu,
dass der Einfluss von Sicherheitsabstand und maximaler Beschleunigung im
erweiterten Szenario eine deutlichere Ausprägung erhält.
Die Ergebnisse repräsentieren einen direkten Leistungsvergleich, der die
zusätzliche Flexibilität des Loadrunner-Systems nicht berücksichtigt. Bei-
spielsweise werden keine Sperrguttransporte simuliert, die ein stetiger Ver-
teilförderer nicht transportieren kann.
6.4 Kritische Reflexion der Hypothesen
Mit der abgeschlossenen Evaluation des entwickelten Verfahrens können die
anfangs aufgestellten Hypothesen zum logistischen Raum einer kritischen
Reflexion unterzogen werden.
H1. Der ideale logistische Raum ist leer, kontinuierlich und kinodyna-
misch.
Der informelle Begriff des idealen logistischen Raums kann durch die Nut-
zung der Raumbegriffe der formalen Bewegungsplanung der Robotik un-
tersucht werden. Der Nachweis dieser Hypothese wird in dieser Arbeit
nicht direkt geführt, sondern indirekt in der Axiomatik der Logistik als Ex-
tremwert eines Kontinuums möglicher logistischer Räume definiert. Dieser
entspricht dem Raum des idealisierten Förderwesens, der keinerlei Lagerung
von Objekten vorsieht, sondern sich ausschließlich mit der Bewegungspla-
nung befasst. Wenn die Vermeidung von Lagerung, wie z. B. im Sinne einer
Just-In-Time-Methodologie, als Ziel der Logistik angesehen wird, dann ist der
leere logistische Raum das zu erreichende Ideal. In diesem Fall wird durch
das entwickelte Verfahren gezeigt, dass ein kontinuierliches Weltmodell mit
Berücksichtigung kinodynamischer Zwangsbedingungen von Vorteil ist und
daher als Grundlage für den idealen logistischen Raum dienen muss.
Die Idee des idealen logistischen Raums ist insofern vor allem für die
wissenschaftliche Betrachtung der Logistik interessant und in der Praxis nur
in den Fällen anwendbar, wo tatsächlich keine Lagerung notwendig ist.
H2. Eine axiomatische Definition der Logistik ist auf Basis des Konzepts
des idealen logistischen Raums möglich.
6.4 Kritische Reflexion der Hypothesen 165
Diese Hypothese wird in der Arbeit durch die entwickelte Axiomatik nach-
gewiesen. Die mathematische Grundlage der Axiomatik „befreit“die Logis-
tikwissenschaft von der Konzentration auf existierende Systeme und ihre
praktischen Einschränkungen. Die starke Ähnlichkeit der Grundlagen mit
der theoretischen Bewegungsplanung der Robotik ermöglicht eine weitrei-
chende Übertragung von Erkenntissen auf die Logistik. Dies ist insbesondere
für Themenbereiche interessant, in denen keine Roboter eingesetzt werden.
Da es sich um die erstmalige Aufstellung einer Axiomatik der Logis-
tik handelt, muss diese als ein „erster Wurf“ angesehen werden, dessen
Allgemeingültigkeit in dieser Arbeit nicht nachgewiesen wird. Eine wich-
tige Erkenntnis der Axiomatik ist die Unterscheidung von gitterbasierten
Weltmodellen für das idealisierte Lagerwesen und kontinuierlichen Weltmo-
dellen für das idealisierte Förderwesen. Dies ermöglicht die Bestimmung
einer grundlegenden Forschungslücke in der Logistik. Die anschließende
Verfahrensentwicklung zur Schließung dieser Lücke erhält so eine allgemeine
Bedeutung, da sie ein grundsätzliches Problem der Logistik löst und nicht
nur eine weitere Logistikanwendung unter vielen repräsentiert (wie z. B. die
Paketsortierung mit Robotern).
H3. Es gibt einen effizient durchführbaren Planungsalgorithmus für eine
Vielzahl von bewegten Objekten im idealen logistischen Raum.
Mit dem in dieser Arbeit entwickelten Verfahren wird diese Hypothese be-
stätigt. Es ist eine effiziente heuristische Bewegungsplanung für den idealen
logistischen Raum und insofern allgemeingültig, als sie nicht für eine spezifi-
sche Anwendung entwickelt wurde. Es ist jedoch kein optimales Verfahren,
und es ist eine Vielzahl von Verbesserungen vorstellbar. Aus Sicht der Robotik
basiert das Verfahren auf bekannten Methoden der Bewegungsplanung. Der
Nachweis seiner Leistungsfähigkeit für die Paketsortierung zeigt erfolgreich
die Vorteile einer kontinuierlichen und kinodynamischen Bewegungspla-
nung im idealen logistischen Raum. Damit kann das entwickelte Verfahren
als Benchmark verwendet werden, dessen Leistungsfähigkeit als Messlatte
für zukünftige Entwicklungen dient.
H4. Eine dezentrale Steuerung logistischer Systeme auf Basis des Pla-
nungsalgorithmus lässt sichmit demKonzept des Cyberphysischen Zwil-
lings umsetzen.
Es kann durch Verfahrensentwicklung gezeigt werden, dass eine Dezentrali-
sierung der Bewegungssteuerung über die modularen Bestandteile des Ver-
fahrens möglich ist. Eine Skalierbarkeit ergibt sich direkt aus dem Verfahren
selbst (es können beliebig viele Objekte gesteuert werden). In der Evaluation
wird mit dem eingesetzten Testbed die Entwicklung nach dem Konzept des
Cyberphysischen Zwillings demonstriert. Hier ist insbesondere die empi-
rische Validierung der grundlegenden kinodynamischen Fähigkeiten der
166 6 Evaluation
Loadrunner von Bedeutung, die es ermöglicht, die Leistungsbestimmung auf
Basis der abstrakten Bewegungsplanung vorzunehmen (im Gegensatz zu ei-
ner vollständigen Simulation aller physischen Bestandteile des Loadrunners).
Der Aufbau der Simulation auf der Bewegungsplanung zeigt, wie durch das
Konzept des Cyberphysischen Zwillings erreicht werden kann, dass sich das
virtuelle Abbild des bewegten Objekts genauso verhält wie das physische
Objekt.
H5. Ein Hochleistungssortiersystem mit klassischer Stetigfördertechnik
kann durch einen Schwarm hochdynamischer Transportroboter ersetzt
werden.
Dem Nachweis dieser Hypothese widmet sich das Kapitel der Evaluation.
Der Nachweis beschränkt sich auf den direkten Vergleich der Leistungswerte
in Paket pro Stunde. Er befasst sich nicht mit den Vorteilen, die aus der
erhöhten Flexibilität entstehen, die eine reduzierte Infrastruktur bietet. Der
Leitgedanke hinter dieser Vorgehensweise ist, dass ein direkter Leistungs-
vergleich die grundlegenden Vorteile hochdynamischer Transportroboter
aufzeigen kann. Wenn das neue Verfahren schon ohne Ausnutzung der Flexi-
bilität eine höhere Leistung als klassische Systeme erreicht, dann wird es in
anspruchsvolleren Szenarien, bei denen Flexibiltät von Vorteil ist, vergleichs-
weise noch bessere Leistungswerte erreichen.
Künstliche Intelligenz
Die Fähigkeit zu einer kontinuierlichenWahrnehmung physischer Objekte ist
eine Grundvoraussetzung dieser Arbeit. Sie wird durch die erwarteten Fort-
schritte in der Künstlichen Intelligenz, insbesondere des Maschinellen Ler-
nens, die Erkennung physischer Objekte erst ermöglichen. Dementsprechend
sind die Ergebnisse dieser Arbeit direkt von der Entwicklung entsprechender
objekterkennender Verfahren abhängig.
Auch wenn diese Arbeit sich im Kern nicht mit Künstlicher Intelligenz
befasst, gewinnt die Aufstellung einer Axiomatik der Logistik vor ihrem
Hintergrund eine weitere Bedeutung. Wenn logistische Modelle zukünftig
automatisiert erlernt werden sollen, dann kann die Axiomatik als Grundlage
für eine Bewertung dienen.
Der Cyberphysische Zwilling ist als Konzept so angelegt, dass eine Inte-
gration von Künstlicher Intelligenz in der Simulation naheliegend ist. Eine
Frage, die in dieser Arbeit nicht behandelt wird, ist, ob eine Bewegungspla-
nung vollständig mit Methoden der Künstlichen Intelligenz durchgeführt
werden kann. Zukünftig ist vorstellbar, dass eine KI-basierte Simulation im
Cyberphysischen Zwilling zum Einsatz kommt.
6.4 Kritische Reflexion der Hypothesen 167
Die Rolle des Menschen
Die Rolle des Menschen in logistischen Systemen wird in dieser Arbeit nicht
betrachtet. Insbesondere der Einfluss von Mensch-Maschine-Interaktionen in
der Bewegungsplanung wird nicht berücksichtigt. Die hohen Geschwindig-
keiten, durch die das entwickelte Verfahren seine Leistungsfähigkeit erreicht,
verhindern eine Integration von Menschen aus Sicherheitsgründen. Dem-
entsprechend ist der ideale logistische Raum, wie er in dieser Arbeit definiert
wurde, menschenleer. Auch die entwickelte Axiomatik nimmt keinen direk-
ten Bezug auf den Menschen und kann somit als unvollständig angesehen
werden.

Kapitel 7
Ergebniszusammenfassung und
Forschungsausblick
Diese Arbeit schließt mit der Zusammenfassung ihrer Ergebnisse, d. h. ei-
ner Aufführung der wichtigsten Erkenntnisse und Beiträge, die sie zum
wissenschaftlichen Fortschritt in ihrem Betrachtungsbereich leistet. Der For-
schungsausblick formuliert Anknüpfungspunkte für weitere Arbeiten, die
sich aus ihnen ergeben.
Erkenntnisse und wissenschaftlicher Beitrag
Die folgenden Ergebnisse sind Bestandteil dieser Arbeit:
• die erstmalige formale Definition des idealen logistischen Raums
• die erstmalige Beschreibung einer Axiomatik der Logistik
• die Definition des Cyberphysischen Zwillings
• die erstmalige Beschreibung eines Kontinuums auf Basis des logistischen
Raums mit den Extrempunkten des idealisierten Lagerwesens und des
idealisierten Förderwesens
• in der Folge die erstmalige Beschreibung eines Verfahrens, das die kon-
fliktfreie Bewegungsplanung vieler physischer Objekte im idealen logis-
tischen Raum effizient durchführt
• der Nachweis, dass ein Sortiersystem auf Basis des Verfahrens leistungs-
fähiger ist als ein klassisches Sortiersystem mit Stetigfördertechnik
• die Beschreibung eines Versuchsfelds für die Entwicklung Cyberphysi-
scher Zwillinge
• die Beschreibung des Loadrunners für hochdynamische Sortieranwen-
dungen in der Logistik
Die Arbeit vereinigt sehr grundlegende Aspekte mit der Neudefintion der
Logistik auf Basis einer Axiomatik. Aus ihr erfolgt die Bestimmung der For-
schungslücke für die Materialflusssteuerung im idealen logistischen Raum,
169
170 7 Ergebniszusammenfassung und Forschungsausblick
der das idealisierte Förderwesen beschreibt. Zur Schließung dieser Lücke
wird ein Verfahren zur Bewegungsplanung entwickelt. Anschließend wird
die Entwicklung des Loadrunners in einem Versuchsfeld auf Basis des Cy-
berphysischen Zwillings beschrieben und in einer Simulationsstudie die
Leistungsfähigkeit in der Paketsortierung untersucht.
Forschungsausblick
Die Ergebnisse dieser Arbeit bieten zahlreiche Anknüpfungspunkte für zu-
künftige Forschungsarbeiten:
• Weiterentwicklung der Axiomatik der Logistik unter Berücksichtigung
der Themenbereiche menschliche Aktivität, Transportwesen und logisti-
sches Management
• Der Fokus dieser Arbeit liegt auf der kontinuierlichen Bewegungspla-
nung für den idealen logistischen Raum, der einen Extrempunkt logisti-
scher Räume abbildet. Denkbar ist die Entwicklung von Verfahren, die
gitterbasierte Bewegungsplanung mit kontinuierlichen Ansätzen kombi-
nieren und somit das gesamte Spektrum logistischer Räume abdecken.
• Entwicklung von optimalen Algorithmen für die Bewegungsplanung im
idealen logistischen Raum
• Erweiterung des Konzepts des Cyberphysischen Zwillings um die
menschliche Aktivitätserkennung und -simulation.
Zusammenfassend stellen die Ergebnisse dieser Arbeit sowohl den Start-
punkt für die Weiterentwicklung einer allgemeinen Logistiktheorie als auch
für die Entwicklung von Transportrobotersystemen im industriellen Kontext
dar.
Literaturverzeichnis
[Alu15] Rajeev Alur. Principles of Cyber-Physical Systems. MIT Press, 2015. ISBN:
978-0-262-02911-7.
[Arn+08a] „Grundlagen: Begriff der Logistik, logistische Systeme und Prozesse“. In:
Handbuch Logistik. Hrsg. von Dieter Arnold u. a. VDI-Buch. Berlin, Heidel-
berg: Springer, 2008, S. 3–34. DOI: 10.1007/978-3-540-72929-7_1.
[Arn+08b] „Lager- und Materialflussprozesse“. In: Handbuch Logistik. Hrsg. von Dieter
Arnold u. a. VDI-Buch. Berlin, Heidelberg: Springer, 2008, S. 371–404. DOI:
10.1007/978-3-540-72929-7_8.
[Ban19] Jagdish Chand Bansal. „Particle Swarm Optimization“. In: Evolutionary and
Swarm Intelligence Algorithms. Hrsg. von Jagdish Chand Bansal, Pramod
Kumar Singh und Nikhil R. Pal. Studies in Computational Intelligence.
Cham: Springer International Publishing, 2019, S. 11–23. DOI: 10.1007/978-
3-319-91341-4_2.
[Bau13] Dieter Baum. Grundlagen der Warteschlangentheorie. Masterclass. Springer
Spektrum, 2013. DOI: 10.1007/978-3-642-39632-8.
[BG88] Phillip J. Barry und Ronald N. Goldman. „A Recursive Evaluation Algo-
rithm for a Class of Catmull-Rom Splines“. In: ACM SIGGRAPH Computer
Graphics 22.4 (Juni 1988), S. 199–204. DOI: 10.1145/378456.378511.
[BJ19] Christoph Beumer undDirk Jodin. „Sortier- und Verteilsysteme“. In: Innerbe-
triebliche Logistik. Hrsg. von Thorsten Schmidt. Fachwissen Logistik. Berlin,
Heidelberg: Springer, 2019, S. 153–173. DOI: 10.1007/978-3-662-57930-5_6.
[Bod+20] Umesh Bodkhe u. a. „A Survey on Decentralized Consensus Mechanisms
for Cyber Physical Systems“. In: IEEE Access 8 (2020), S. 54371–54401. DOI:
10.1109/ACCESS.2020.2981415.
[But11] Giorgio C. Buttazzo. Hard Real-Time Computing Systems: Predictable Schedu-
ling Algorithms and Applications. 3rd. Springer Publishing Company, Incor-
porated, 2011. ISBN: 978-1-4614-0675-4.
[CKV21] Brennan Cain, Michail Kalaitzakis und Nikolaos Vitzilaios. „MK-RRT*:
Multi-Robot Kinodynamic RRT* Trajectory Planning“. In: 2021 International
Conference on Unmanned Aircraft Systems (ICUAS). Juni 2021, S. 868–876. DOI:
10.1109/ICUAS51884.2021.9476688.
[CR74] Edwin Catmull und Raphael Rom. „A Class of Local Interpolating Splines“.
In: Computer Aided Geometric Design. Elsevier, 1974, S. 317–326.
[Dan14] Damian Daniluk.Verteilte Simulation und Emulation vonMaterialflusssystemen
mit dezentraler Steuerung. Dortmund: Verlag Praxiswissen, 2014. ISBN: 978-3-
86975-093-4.
[Deu98] Deutsches Institut für Normung e. V., Hrsg. DIN 19233: Leittechnik - Prozeß-
automatisierung - Automatisierung mit Prozeßrechensystemen, Begriffe. 1998.
171
172 Literaturverzeichnis
[DVD20] M. De Ryck, M. Versteyhe und F. Debrouwere. „Automated Guided Vehicle
Systems, State-of-the-Art Control Algorithms and Techniques“. In: Journal
of Manufacturing Systems 54 (Jan. 2020), S. 152–173. DOI: 10.1016/j.jmsy.2019.
12.002.
[Fle21] Flexlog. Gridsorter. 2021. URL: https://www.flexlog.de/de/gridsorter/.
[FS21] Jörg Franke und Peter Schuderer. „Simulationsbasierte Untersuchung der
Grenzproduktivität von Robotern in einem AutoStore-Lagersystem“. In:
Simulation in Produktion und Logistik 2021: Erlangen, 15.-17. September 2021
(2021), S. 197. URL: http ://www.asim-fachtagung-spl .de/asim2021/
papers/Proof_199.pdf.
[Gar19] Felipe Garcia Lopez. Predictive and Cooperative Online Motion Planning : A
Contribution to Networked Mobile Robot Navigation in Industrial Applications.
Stuttgart : Fraunhofer Verlag, 2019. DOI: 10.18419/opus-10715.
[Gud10a] Timm Gudehus. „Aufgaben und Aspekte der Logistik“. In: Logistik: Grund-
lagen - Strategien - Anwendungen. Berlin, Heidelberg: Springer, 2010, S. 3–42.
DOI: 10.1007/978-3-540-89389-9_1.
[Gud10b] Timm Gudehus. „Transportsysteme“. In: Logistik: Grundlagen - Strategien -
Anwendungen. Berlin, Heidelberg: Springer, 2010, S. 775–873. DOI: 10.1007/
978-3-540-89389-9_18.
[Gue+14] Kevin R. Gue u. a. „GridStore: A Puzzle-Based Storage System With Decen-
tralized Control“. In: IEEE Transactions on Automation Science and Engineering
11.2 (Apr. 2014), S. 429–438. DOI: 10.1109/TASE.2013.2278252.
[Guy+09] Stephen. J. Guy u. a. „ClearPath: Highly Parallel Collision Avoidance for
Multi-Agent Simulation“. In: Proceedings of the 2009 ACM SIGGRAPH/Euro-
graphics Symposium on Computer Animation. SCA ’09. New York, NY, USA:
Association for Computing Machinery, Aug. 2009, S. 177–187. DOI: 10.1145/
1599470.1599494.
[He+18] Meiling He u. a. „Logistics Space: A Literature Review from the Sustainabi-
lity Perspective“. In: Sustainability 10.8 (Aug. 2018), S. 2815. DOI: 10.3390/
su10082815.
[Hug+13] John Hughes u. a. Computer Graphics: Principles and Practice. 3. Edition. Up-
per Saddle River, New Jersey: Addison-Wesley, Juli 2013. ISBN: 978-0-321-
39952-6.
[Jt12] Dirk Jodin und Michael ten Hompel. „Einleitung“. In: Sortier- und Verteilsys-
teme: Grundlagen, Aufbau, Berechnung und Realisierung. Hrsg. von Dirk Jodin
und Michael ten Hompel. VDI-Buch. Berlin, Heidelberg: Springer, 2012,
S. 1–23. DOI: 10.1007/978-3-642-31290-8_1.
[JY94] Hsu Wen Jing und Huang Shell Ying. „Route Planning of Automated Gui-
ded Vehicles“. In: Proceedings of the Intelligent Vehicles ’94 Symposium. Okt.
1994, S. 479–484. DOI: 10.1109/IVS.1994.639565.
[KE95] J. Kennedy und R. Eberhart. „Particle Swarm Optimization“. In: Proceedings
of ICNN’95 - International Conference on Neural Networks. Bd. 4. Nov. 1995,
1942–1948 vol.4. DOI: 10.1109/ICNN.1995.488968.
[Kri+18] Werner Kritzinger u. a. „Digital Twin in Manufacturing: A Categorical
Literature Review and Classification“. In: IFAC-PapersOnLine. 16th IFAC
Symposium on Information Control Problems in Manufacturing INCOM
2018 51.11 (Jan. 2018), S. 1016–1022. DOI: 10.1016/j.ifacol.2018.08.474.
Literaturverzeichnis 173
[Lan+18] Giesela Lanza u. a. Wandlungsfähige, menschzentrierte Strukturen in Fabri-
ken und Netzwerken der Industrie 4.0 (acatech Studie). Techn. Ber. Mün-
chen: Herbert Utz Verlage, 2018. URL: https : / / www . acatech . de /
publikation/wandlungsfaehige-menschzentrierte-strukturen-in-fabriken-
und-netzwerken-der-industrie-4-0/download-pdf/?lang=de.
[LaV06] Steven M. LaValle. Planning Algorithms. Cambridge: Cambridge University
Press, 2006. DOI: 10.1017/CBO9780511546877.
[LSB09] Boris Lau, Christoph Sprunk und Wolfram Burgard. „Kinodynamic Motion
Planning for Mobile Robots Using Splines“. In: 2009 IEEE/RSJ International
Conference on Intelligent Robots and Systems. Okt. 2009, S. 2427–2433. DOI:
10.1109/IROS.2009.5354805.
[Lun10] Jan Lunze. „Zielstellung und theoretische Grundlagen der Regelungstech-
nik“. In: Regelungstechnik 1: Systemtheoretische Grundlagen, Analyse und Ent-
wurf einschleifiger Regelungen. Hrsg. von Jan Lunze. Springer-Lehrbuch.
Berlin, Heidelberg: Springer, 2010, S. 1–18. DOI: 10.1007/978-3-642-13808-
9_1.
[NWW21] Livinus Obiora Nweke, Goitom K. Weldehawaryat und Stephen D. Wol-
thusen. „Threat Modelling of Cyber–Physical Systems Using an Applied
π-Calculus“. In: International Journal of Critical Infrastructure Protection 35
(Dez. 2021), S. 100466. DOI: 10.1016/j.ijcip.2021.100466.
[NXZ20] Bach Hoai Nguyen, Bing Xue und Mengjie Zhang. „A Survey on Swarm
Intelligence Approaches to Feature Selection in Data Mining“. In: Swarm
and Evolutionary Computation 54 (Mai 2020), S. 100663. DOI: 10.1016/j.swevo.
2020.100663.
[Nyh10] Peter Nyhuis.Wandlungsfähige Produktionssysteme. GITO mbH Verlag, 2010.
ISBN: 978-3-942183-15-4.
[PL11] Mike Phillips und Maxim Likhachev. „SIPP: Safe Interval Path Planning for
Dynamic Environments“. In: 2011 IEEE International Conference on Robotics
and Automation. Mai 2011, S. 5628–5635. DOI: 10.1109/ICRA.2011.5980306.
[Que01] Boto von Querenburg.Mengentheoretische Topologie. Springer-Lehrbuch. Ber-
lin Heidelberg: Springer, 2001. ISBN: 978-3-540-67790-1.
[Rey87] Craig W. Reynolds. „Flocks, Herds and Schools: A Distributed Behavioral
Model“. In: Proceedings of the 14th Annual Conference on Computer Graphics
and Interactive Techniques. SIGGRAPH ’87. New York, NY, USA: Association
for Computing Machinery, Aug. 1987, S. 25–34. DOI: 10.1145/37401.37406.
[Roe+12] Christoph Roesmann u. a. „Trajectory Modification Considering Dynamic
Constraints of Autonomous Robots“. In: ROBOTIK 2012; 7th German Con-
ference on Robotics. Mai 2012, S. 1–6. URL: https://ieeexplore. ieee.org/
document/6309484.
[Sch+17] Günther Schuh u. a. Industrie 4.0 Maturity Index – Die digitale Transformation
von Unternehmen gestalten (acatech Studie). Techn. Ber. München: Herbert
Utz Verlage, 2017. URL: https://www.acatech.de/publikation/industrie-
4 - 0 -maturity - index - die - digitale - transformation - von - unternehmen -
gestalten/download-pdf?lang=de.
[Sch+20] Kira Schmeltzpfenning u. a. WMS Marktreport Kompakt 2020. Trends und
Entwicklungen auf dem Markt für Warehouse Management Systeme. Mün-
chen: Fraunhofer-Gesellschaft, 2020. URL: http://publica.fraunhofer.de/
dokumente/N-621775.html.
174 Literaturverzeichnis
[Sei16] Zäzilia Seibold. Logical Time for Decentralized Control of Material Handling
Systems. KIT Scientific Publishing, Nov. 2016. ISBN: 978-3-7315-0567-9.
[Sem15] Kai Semrau. Leistungsermittlung und Layoutgestaltung von Stückgutsortiersys-
temen. Dortmund: Verlag Praxiswissen, 2015. ISBN: 978-3-86975-111-5.
[SF20] Zäzilia Seibold und Kai Furmans. „Plug&Play-Fördertechnik in der Indus-
trie 4.0“. In: Handbuch Industrie 4.0: Band 3: Logistik. Hrsg. von Michael ten
Hompel, Thomas Bauernhansl und Birgit Vogel-Heuser. Berlin, Heidelberg:
Springer, 2020, S. 81–97. DOI: 10.1007/978-3-662-58530-6_2.
[Sha+15] Guni Sharon u. a. „Conflict-Based Search for Optimal Multi-Agent Pathfin-
ding“. In: Artificial Intelligence 219 (Feb. 2015), S. 40–66. DOI: 10.1016/j.artint.
2014.11.006.
[SK90] Horst Strunz und Karl Kurbel. Handbuch Wirtschaftsinformatik. Poeschel,
1990. ISBN: 3-7910-0499-9.
[Spr08] Christoph Sprunk. Planning Motion Trajectories for Mobile Robots Using Spli-
nes. 2008. URL: http://www2.informatik.uni-freiburg.de/~lau/students/
Sprunk2008.pdf.
[SS20] Oren Salzman und Roni Stern. „Research Challenges and Opportunities in
Multi-Agent Path Finding andMulti-Agent Pickup and Delivery Problems“.
In: Proceedings of the 19th International Conference on Autonomous Agents and
MultiAgent Systems. AAMAS ’20. Richland, SC, Mai 2020, S. 1711–1715. URL:
http://www.orensalzman.com/docs/AAMAS20.pdf.
[Ste15] James Stewart. Calculus: Early Transcendentals. 8. Edition. Boston, MA, USA:
Cengage Learning, Feb. 2015. ISBN: 978-1-285-74155-0.
[Sun+20] Weifeng Sun u. a. „A Survey of Using Swarm Intelligence Algorithms in
IoT“. In: Sensors 20.5 (Jan. 2020), S. 1420. DOI: 10.3390/s20051420.
[ten+20] Michael ten Hompel u. a. „Technical Report: LoadRunner©R , a New Plat-
form Approach on Collaborative Logistics Services“. In: Logistics Journal
: nicht referierte Veröffentlichungen 2020.10 (Okt. 2020). DOI: 10 . 2195/ lj _
NotRev_tenhompel_en_202010_01.
[tK15] Michael ten Hompel und Sören Kerner. „Logistik 4.0“. In: Informatik-
Spektrum 38.3 (Juni 2015), S. 176–182. DOI: 10.1007/s00287-015-0876-y.
[tSB11] Michael ten Hompel, Volker Sadowsky und Maria Beck. „Leistungsermitt-
lung von Kommissioniersystemen“. In: Kommissionierung: Materialflusssyste-
me 2 - Planung und Berechnung der Kommissionierung in der Logistik. VDI-Buch.
Berlin, Heidelberg: Springer, 2011, S. 127–205. DOI: 10.1007/978-3-540-29940-
0_7.
[tSD18] Michael ten Hompel, Thorsten Schmidt und Johannes Dregger. „Verpa-
ckungssysteme“. In:Materialflusssysteme: Förder- und Lagertechnik. VDI-Buch.
Berlin, Heidelberg: Springer, 2018, S. 5–50. DOI: 10.1007/978-3-662-56181-
2_2.
[Ulu14] Onur Uludag. „GridPick: A High Density Puzzle Based Order Picking
System with Decentralized Control“. Diss. Auburn University, Jan. 2014.
URL: https://etd.auburn.edu//handle/10415/3984.
[van+11a] Jur van den Berg u. a. „Reciprocal Collision Avoidance with Acceleration-
Velocity Obstacles“. In: 2011 IEEE International Conference on Robotics and
Automation. Mai 2011, S. 3475–3482. DOI: 10.1109/ICRA.2011.5980408.
Literaturverzeichnis 175
[van+11b] Jur van den Berg u. a. „Reciprocal N-Body Collision Avoidance“. In: Robotics
Research. Hrsg. von Cédric Pradalier, Roland Siegwart und Gerhard Hir-
zinger. Springer Tracts in Advanced Robotics. Berlin, Heidelberg: Springer,
2011, S. 3–19. DOI: 10.1007/978-3-642-19457-3_1.
[Ver10] Verein Deutscher Ingenieure. VDI-Richtlinie 3633 Blatt 1: Simulation von
Logistik-, Materialfluss- und Produktionssystemen, Grundlagen (Gründdruck).
2010.
[Ver83] Verein Deutscher Ingenieure. VDI-Richtlinie 3619: Sortiersysteme für Stückgut.
1983.
[Ver94] Verband Deutscher Maschinen- und Anlagenbau e. V. (VDMA). VDMA-
Einheitsblatt 15276: Datenschnittstellen in Materialflusssystemen. 1994.
[vLM08] Jur van den Berg, Ming Lin und Dinesh Manocha. „Reciprocal Velocity
Obstacles for Real-Time Multi-Agent Navigation“. In: 2008 IEEE Interna-
tional Conference on Robotics and Automation. Mai 2008, S. 1928–1935. DOI:
10.1109/ROBOT.2008.4543489.
[WDM08] Peter R. Wurman, Raffaello D’Andrea und Mick Mountz. „Coordinating
Hundreds of Cooperative, Autonomous Vehicles in Warehouses“. In: AI
Magazine 29.1 (März 2008), S. 9. DOI: 10.1609/aimag.v29i1.2082.
[Wen18] Sigrid Wenzel. „Simulation logistischer Systeme“. In:Modellierung logisti-
scher Systeme. Hrsg. von Horst Tempelmeier. Fachwissen Logistik. Berlin,
Heidelberg: Springer, 2018, S. 1–34. DOI: 10.1007/978-3-662-57771-4_1.
[Wur17] Christian Wurll. „Das bewegliche Lager auf Basis eines Cyber-physischen
Systems“. In: Handbuch Industrie 4.0 Bd.3: Logistik. Hrsg. von Birgit Vogel-
Heuser, Thomas Bauernhansl und Michael ten Hompel. Springer Reference
Technik. Berlin, Heidelberg: Springer, 2017, S. 151–177. DOI: 10.1007/978-3-
662-53251-5_12.
[Yan+17] Feng Yang u. a. „Survey of Swarm Intelligence Optimization Algorithms“.
In: 2017 IEEE International Conference on Unmanned Systems (ICUS). Okt.
2017, S. 544–549. DOI: 10.1109/ICUS.2017.8278405.
[YSK09] Cem Yuksel, Scott Schaefer und John Keyser. „On the Parameterization of
Catmull-Rom Curves“. In: 2009 SIAM/ACM Joint Conference on Geometric and
Physical Modeling. SPM ’09. New York, NY, USA: Association for Computing
Machinery, Okt. 2009, S. 47–53. DOI: 10.1145/1629255.1629262.
[Zei+17] Felix Zeidler u. a. „Referenzfeld zur Erforschung und Entwicklung neuar-
tiger hybrider Formen der Zusammenarbeit von Menschen und Maschi-
nen in der Logistik“. In: Logistics Journal : Proceedings 2017.10 (2017). DOI:
10.2195/lj_Proc_zeidler_de_201710_01.