Zur innerbetrieblichen Logistik – Axiomatik und Betrachtung als kinodynamisches System Zur Erlangung des akademischen Grades eines Dr.-Ing. von der Fakultät Maschinenbau der Technischen Universität Dortmund genehmigte Dissertation Dipl.-Inform. Moritz Johannes Roidl aus Hamm (Westfalen), Deutschland Tag der mündlichen Prüfung: 13.07.2022 Erster Gutachter: Prof. Dr. Dr. h. c. Michael ten Hompel Zweiter Gutachter: Prof. Dr. Jakob Rehof Dortmund, 2022 Kurzfassung Der Anspruch zeitgemäßer Logistikforschung ist die Modellierung ihrer Herausforderungen und Probleme aus logistischer Sicht. Dabei ist die Be- trachtung von Einzelproblemstellungen aus Perspektive der beteiligten Dis- ziplinen und Fachbereiche zu überwinden, um zu einer übergeordneten Theorie zu finden, die anwendungsunabhängige Gültigkeit besitzt. Ein erster Schritt zu diesem Ziel wird in dieser Promotionsschrift durch die erstmalige Definition einer Axiomatik der Logistik versucht. Zentrale Zielstellung dieser Arbeit ist die Entwicklung eines allgemein- gültigen Verfahrens kinodynamischer Bewegungsplanung im idealen logisti- schen Raum auf Basis der Axiomatik. Die zu schließende Forschungslücke ergibt sich aus der Erkenntnis, dass für das durch den idealen logistischen Raum repräsentierte idealisierte Förderwesen bislang kein solches Verfahren existiert. Ein Herausstellungsmerkmal des neuen Verfahrens ist die Verwen- dung eines kontinuierlichen Weltmodells, das sich von bereits etablierten git- terbasierten Ansätzen durch die Berücksichtigung kinodynamischer Zwangs- bedingungen abgrenzt. Das Schließen der Forschungslücke ermöglicht eine prinzipiell vollständige Beschreibung logistischer Bewegungsplanung. Das entwickelte Verfahren wird anhand eines neuartigen Transportrobo- tersystems für hochdynamische Sortieranwendungen validiert. In diesem Zuge wird das Konzept des Cyberphysischen Zwillings definiert. Damit einher geht die Konzeptionierung eines Versuchsfelds für die Entwicklung Cyberphysischer Zwillinge sowie der experimentelle Nachweis, dass ein schwarmbasiertes Sortiersystem mit diesem Verfahren leistungsfähiger ist als ein aktuelles Hochleistungssortiersystem mit Stetigfördertechnik. i Abstract The aspiration of contemporary logistics research is its capability to model its challenges and problems from a logistics perspective. In doing so, the consideration of individual problems from the perspective of the disciplines and fields involved must be overcome in order to find a superordinate theory that holds application-independent validity. A first step towards that goal is attempted in this dissertation by defining an axiomatic of logistics for the first time. The central objective of this thesis is the development of a universally applicable method of kinodynamic motion planning in the ideal logistic space based on the axiomatics. The research gap to be filled arises from the finding that for an idealized transport system, which is represented by the ideal logistic space, no such method exists so far. A specific feature of the new method is the use of a continuous world model, which differs from already established grid-based approaches by considering kinodynamic constraints. In principle, closing this research gap enables a complete description of logistic motion planning. The developed method is validated using a novel transport robot system for dynamic sorting applications with high throughput. In doing so, the concept of a Cyberphysical Twin is defined. This is accompanied by the design of an experimentation environment for the development of Cyber- physical Twins as well as the experimental evidence that a swarm-based sorting system using this method is more performant than a state-of-the-art high-performance sorting system with continuous conveyor technology. iii Inhaltsverzeichnis Abbildungsverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . vii 1 Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Forschungsfragen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1.3 Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.4 Vorgehen und Struktur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2 Grundlagen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.1 Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 2.2 Cyberphysische Systeme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2.3 Digitaler Zwilling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.4 Planung und Verwaltung von Objektbewegungen . . . . . . . . . . . 26 2.4.1 Grundlagen der Bewegungsplanung . . . . . . . . . . . . . . . . . 31 2.4.2 Bewegungsplanung in diskreten Weltmodellen . . . . . . . 33 2.4.3 Bewegungsplanung in kontinuierlichen Weltmodellen 36 2.4.4 Zeitabhängige Bewegungsplanung . . . . . . . . . . . . . . . . . . 47 2.4.5 Bewegungsplanung für mehrere Objekte . . . . . . . . . . . . . 49 2.4.6 Planung unter differenziellen Zwangsbedingungen . . . 52 3 Axiomatik der Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.1 Motivation für eine axiomatische Betrachtung . . . . . . . . . . . . . . . 62 3.2 Aufbau der Axiomatik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 3.3 Zur Beobachtung in logistischen Systemen . . . . . . . . . . . . . . . . . . 82 3.4 Konzeption eines Cyberphysischen Zwillings . . . . . . . . . . . . . . . 84 4 Anforderungen, existierende Arbeiten und Forschungslücke . . . . 89 4.1 Anforderungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 4.2 Existierende Arbeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 4.2.1 Logistik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 v vi Inhaltsverzeichnis 4.2.2 Robotik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 4.3 Grenzen existierender Verfahren . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.4 Forschungslücke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 5 Verfahren zur kinodynamischen Bewegungsplanung . . . . . . . . . . . 101 5.1 Gestaltung des idealen logistischen Raums . . . . . . . . . . . . . . . . . 102 5.2 Bestandteile und Ablauf des Verfahrens . . . . . . . . . . . . . . . . . . . . 104 5.3 Splinebasierte Trajektorien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 5.4 Numerisches Geschwindigkeitsprofil . . . . . . . . . . . . . . . . . . . . . . . 119 5.5 Bestimmung der Geschwindigkeiten . . . . . . . . . . . . . . . . . . . . . . . 127 5.6 Kollisionsfreie Bewegung mehrerer Objekte . . . . . . . . . . . . . . . . . 131 5.6.1 Das Verfahren als Zustandsautomat . . . . . . . . . . . . . . . . . . 141 5.6.2 Heuristische Verbesserung . . . . . . . . . . . . . . . . . . . . . . . . . . 145 6 Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 6.1 Testbed für die Entwicklung Cyberphysischer Zwillinge . . . . . 148 6.2 Empirische Evaluation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 6.3 Simulationsstudie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 6.3.1 Versuchsdurchführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 6.3.2 Ergebnisse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 6.4 Kritische Reflexion der Hypothesen . . . . . . . . . . . . . . . . . . . . . . . . 164 7 Ergebniszusammenfassung und Forschungsausblick . . . . . . . . . . . 169 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Abbildungsverzeichnis 1.1 Industrie-4.0-Reifegradindex . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.2 Entwicklung einer Logistik 4.0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.3 Vorgehen und inhaltliche Struktur der Forschungsarbeit . . . . . . . . . 8 2.1 Zusammenhang von Liefer-, Auftragsdurchlauf- und Materialdurchlaufzeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2.2 Sortertopologien . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 2.3 Mehrebenensteuerung der Regelungstechnik . . . . . . . . . . . . . . . . . . . . 15 2.4 Grundstruktur eines Regelkreises . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 2.5 Grundstruktur des Digitalen Zwillings . . . . . . . . . . . . . . . . . . . . . . . . . 24 2.6 Digitaler Zwilling im Raum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.7 Digitaler Zwilling eines Roboters . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.8 Kollision durch Kreuzung und Überlappung . . . . . . . . . . . . . . . . . . . . 26 2.9 Frontal- und Heckkollision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 2.10 Staubildung durch Warten im Stillstand . . . . . . . . . . . . . . . . . . . . . . . . 28 2.11 Entstehung eines Livelocks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.12 Entstehung eines lokalen Deadlocks . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.13 Entstehung eines nichtlokalen Deadlocks . . . . . . . . . . . . . . . . . . . . . . . 29 2.14 Unendliches gitterbasiertes Weltmodell . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.15 Endliches gitterbasiertes Weltmodell mit Hindernissen . . . . . . . . . . . 34 2.16 Ungünstige Trajektorie für kinodynamische Bewegungsplanung . 59 3.1 Beispiele gitterbasierter und freier Bewegung in der Logistik . . . . . 62 3.2 Beispiel der Erdoberfläche als Mannigfaltigkeit . . . . . . . . . . . . . . . . . . 66 3.3 Beispiel zellularer Strukturen im Mobilfunk . . . . . . . . . . . . . . . . . . . . . 66 3.4 Beispiel einer Mannigfaltigkeit in der Intralogistik . . . . . . . . . . . . . . . 67 3.5 Topologische Umgebung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.6 Beispiel eines logistischen Raums mit Orten . . . . . . . . . . . . . . . . . . . . . 69 3.7 Beispiel eines Blockzeilenlagers und seiner räumlichen Struktur . . 69 3.8 Beinhalten und Vereinigung von logistischen Objekten . . . . . . . . . . . 72 vii viii Abbildungsverzeichnis 3.9 Beispiel einer räumlichen Struktur auf einem Ladehilfsmittel . . . . . 73 3.10 Palettendurchlaufregal als kinodynamisches System . . . . . . . . . . . . . 73 3.11 Nachbarschaft logistischer Objekte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 3.12 Logistischer Weg und Homotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 3.13 Disjunkte logistische Wege und Wege mit Konfliktzonen . . . . . . . . . 77 3.14 Beispiele logistischer Warteschlangen . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 3.15 Idealisiertes Förder- und Lagerwesen . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3.16 Cyberphysischer Zwilling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 3.17 Systeme von verteilten Cyberphysischen Zwillingen . . . . . . . . . . . . . 87 4.1 Vorgehen zur Bestimmung der Forschungslücke . . . . . . . . . . . . . . . . 90 5.1 Objekte im idealen logistischen Raum . . . . . . . . . . . . . . . . . . . . . . . . . . 102 5.2 Last- und Leerfahrt im idealen logistischen Raum . . . . . . . . . . . . . . . 103 5.3 Datenstruktur der Bewegungskoordination . . . . . . . . . . . . . . . . . . . . . 105 5.4 Bestandteile des entwickelten Verfahrens . . . . . . . . . . . . . . . . . . . . . . . 108 5.5 Homotope Pfade im idealen logistischen Raum. . . . . . . . . . . . . . . . . . 109 5.6 Beispiel eines Catmull-Rom-Splines . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.7 Unterschiedliche Parametrisierung eines Catmull-Rom-Splines . . . 119 5.8 Bahnkurve mit Krümmungskreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 5.9 Schema der Krümmung am Kreis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 5.10 Standardfahrrampe und spitze Fahrrampe . . . . . . . . . . . . . . . . . . . . . . 130 5.11 Worst-Case-Szenario für die Laufzeit des Verfahrens . . . . . . . . . . . . . 140 5.12 Verfahren zur Kollisionsvermeidung als Zustandsautomat . . . . . . . 142 5.13 Veranschaulichung der Kollisionsvermeidung . . . . . . . . . . . . . . . . . . . 143 5.14 Weiterentwickelter Zustandsautomat zur Kollisionsvermeidung . . 144 5.15 Trajektorien auf der Basis homotoper Bahnkurven . . . . . . . . . . . . . . . 145 6.1 Gesamtansicht des Testbeds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 6.2 Architektur der Entwicklungsumgebung des Testbeds . . . . . . . . . . . 150 6.3 Designstudie des Loadrunners . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151 6.4 Simulationsumgebung für die Entwicklung und Evaluation des Loadrunners . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 6.5 Loop-Sorter mit einem Einschleusbereich . . . . . . . . . . . . . . . . . . . . . . . 154 6.6 Loop-Sorter mit zwei Einschleusbereichen . . . . . . . . . . . . . . . . . . . . . . 155 6.7 Loadrunner-Sortiersystem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 6.8 Screenshot des Basisszenarios vor der Simulation . . . . . . . . . . . . . . . . 160 6.9 Screenshot des Basisszenarios während der Simulation . . . . . . . . . . 160 6.10 Leistungswerte im Basisszenario bei 4m/s2 . . . . . . . . . . . . . . . . . . . . . 160 6.11 Leistungswerte im Basisszenario bei 5m/s2 . . . . . . . . . . . . . . . . . . . . . 161 6.12 Layout des erweiterten Szenarios vor dem Start der Simulation . . . 162 6.13 Screenshot des erweiterten Szenarios vor der Simulation . . . . . . . . . 162 6.14 Screenshot des erweiterten Szenarios während der Simulation . . . . 162 Abbildungsverzeichnis ix 6.15 Leistungswerte im erweiterten Szenario bei 4m/s2 . . . . . . . . . . . . . . 163 6.16 Leistungswerte im erweiterten Szenario bei 5m/s2 . . . . . . . . . . . . . . 163 Kapitel 1 Einleitung Die Logistik ist die bewegende Instanz der vierten industriellen Revolution. Sie wird als vorrangiges Anwendungsfeld für die Einführung cyberphysi- scher Systeme gesehen und gilt als die Branche, in der das Internet der Dinge seine vollständige Umsetzung erfahren wird. Zugleich wurde die Hypothese aufgestellt, dass Produktions- und Logistiksysteme auf Basis sich selbst steu- ernder, weitgehend autonomer cyberphysischer Systeme flexibler einsetzbar und zugleich effizienter und leistungsfähiger seien. Diese Promotionsschrift widmet sich den grundlegenden wissenschaftli- chen Gestaltungsprinzipien für die Bewegungsplanung in Logistiksystemen. Die zentrale Zielsetzung der Arbeit kann folgendermaßen beschrieben wer- den: Entwicklung eines allgemeingültigen Verfahrens kinodynamischer Bewegungs- planung im idealen logistischen Raum auf Basis einer Axiomatik der Logistik. Zur Erreichung der vorgenannten Zielsetzung wird im Rahmen der Arbeit erstmalig eine Axiomatik der Logistik entwickelt, die sich an der theoreti- schen Bewegungsplanung der Robotik orientiert und diese mit Begriffen der Logistik verbindet. Auf Basis der Axiomatik wird eine Forschungslücke unter den Verfahren der Bewegungsplanung für logistische Systeme identifiziert. Ein solches Verfahren wird für den idealen logistischen Raum entwickelt und anhand des Cyberphysischen Zwillings eines neuartigen Transportroboters validiert. Ein Herausstellungsmerkmal des Verfahrens ist die Verwendung eines kontinuierlichen Weltmodells im Gegensatz zu gitterbasierten Ansät- zen. Die Validierung zeigt, dass ein Schwarm autonomer Transportroboter durch das Verfahren in der Lage ist, die Leistung eines stetig fördernden, klassischen Hochleistungssortiersystems deutlich zu übertreffen. 1.1 Motivation Diese Arbeit ist im Kern durch eine fehlende wissenschaftliche Betrach- tung der Bewegungsplanung in der Logistik motiviert. Es gibt bislang keine wissenschaftlichen Grundlagen für eine einheitliche und anwendungsunab- 1 2 1 Einleitung hängige Entwicklung von Verfahren der Bewegungsplanung in logistischen Systemen. Insbesondere die Abhängigkeit von manuell erstellten, anwen- dungsnahen Modellen der Logistik, die auf eine menschliche Beobachtung spezifischer existierender Systeme zurückgehen, schränkt den Betrachtungs- raum bisheriger Logistikforschung ein. Wenn die Logistik die bewegende Instanz einer Industrie 4.0 sein soll, dann ist es notwendig, deren neue Prinzipien als Grundlage für eine wissenschaft- liche Definition der Logistik aufzugreifen. Anschaulich lässt sich das anhand von Abbildung 1.1 erkennen. Auf Basis der Digitalisierung industrieller Systeme, die durch eine Computerisierung und Kommunikationsfähigkeit gekennzeichnet ist, entsteht eine Industrie 4.0 durch Sichtbarkeit und Transpa- renz. Gemeint ist damit, dass eine erhöhte technische Wahrnehmungsfähig- keit der Systeme zu einer automatisierten Erkennung ihres Zustands und – das ist im Fall der Logistik wichtig – ihrer physischen Umgebung führt. Im Prinzip wird damit eine datengetriebenen Welt beschrieben, in der Modelle nicht mehr manuell erstellt, sondern erlernt und laufend angepasst werden können. So wird eine automatisierte Prognosefähigkeit und Adaptierbarkeit erreicht. Digitalisierung Industrie 4.0 Sichtbarkeit, Transparenz Adaptierbarkeit und Computerisierung Prognosefähigkeit und Kommunikation 1 2 3 4 5 6 Abb. 1.1 Industrie-4.0-Reifegradindex nach [Sch+17] Übertragen auf eine Logistik 4.0 kommt der technischenWahrnehmungsfähig- keit eine neue, essenzielle Rolle zu. Der Entwurf eines logistischen Systems beginnt nicht mehr mit der Auswahl physischer Systemkomponenten. Viel- mehr gilt es, zuerst das Abbild des physischen Raums zu definieren, in dem die Bewegung von Objekten geplant wird. Abbildung 1.2 veranschaulicht diese Vorgehensweise: Transparenz, Prognosefähigkeit und Adaptierbarkeit sind Eigenschaften, die durch den Entwurf eines logistischen Raums ermög- licht werden. Dieser Gedankengang findet sich implizit in einer als rich- tungsweisende Forderung aufgestellten Aussage in einem Artikel über einen Nutzen 1.1 Motivation 3 Paradigmenwechsel in der Logistik im Kontext von Industrie 4.0 (vgl. [tK15]): Der ideale logistische Raum ist leer. Der Artikel beschreibt die Herausforderungen beim Entwurf logistischer Systeme unter einer steigenden Volatilität des Produktions- und Handels- umfeldes. Die erforderliche zukünftige logistische Leistung eines Systems muss demnach bereits zu Beginn für Jahre im Voraus bestimmt werden. Die Unwägbarkeiten bei der Bestimmung führen zu einer maximalen Leistung, die als technische Grenzleistung vom System gefordert wird. Nach dem Artikel basieren die existierenden analytischen Entwurfsmethoden zu weiten Teilen auf diesen Grenzleistungsrechnungen, die einzeln für die jeweiligen Systemkomponenten durchgeführt werden. Neben den groben analytischen Methoden werden Methoden der Materialflusssimulation mit Modellen in unterschiedlichen Abstraktionsgraden verwendet. Diese Vorgehensweise führt zu hochperformanten Systemen, die im Gegenzug unflexibel und nur bedingt skalierbar sind. Digitalisierung Logistik 4.0 cyberphysische kontinuierliche Systeme Wahrnehmung idealer Datenströme logistischer Raum 1 2 3 4 5 6 Abb. 1.2 Entwicklung einer Logistik 4.0 Der hauptsächliche Grund dieser Inflexibilität ist die fest verbaute lokale In- frastruktur klassischer, hochperformanter Intralogistiksysteme. Ein Beispiel sind Sortiersysteme, die in Abschnitt 2.1 beschrieben werden. Sie bestehen aus fest verbauter Stetigfördertechnik, die über klassische Automatisierungs- technik gesteuert wird. Diese Systeme sind aufwändig über physische Bau- maßnahmen zu ändern und entsprechend schwierig ist eine Änderung des Standorts, in den meisten Fällen nur unwirtschaftlich zu erreichen ist. 4 1 Einleitung 1.2 Forschungsfragen In den folgenden Abschnitten soll der Begriff des idealen, leeren logistischen Raums genauer untersucht werden, um darüber die zentralen Forschungs- fragen und Hypothesen dieser Arbeit herzuleiten. Der ideale Raum In der Analyse logistischer Systeme kann ein idealer Raum als Idealtypus ver- standen werden, der keine bekannten Systeme abbildet, sondern alsMesslatte dient, um die logistische Wirklichkeit trennscharf analysieren zu können. Beim Entwurf logistischer Systeme ist ein idealer Raum hingegen als Vollkom- menheitsmuster anzusehen, dem der Entwurf als Leitlinie folgt, deren Realisie- rung nicht vollständig erfüllt werdenmuss. Diese Ansicht impliziert, dass der ideale Raum Teil eines multikriteriellen Optimierungsprozesses ist, dessen spezifische Eigenschaften die Minimierungs- und Maximierungsstrategien beim Entwurf eines Systems beeinflussen. Dabei stellt sich grundsätzlich die Frage, ob es einen einzigen idealen Raum für alle logistischen Systeme gibt oder mehrere Arten idealer Räume existieren können. Der logistische Raum Über den Begriff des logistischen Raums findet sich in der Literatur weder eine einheitliche noch eine formale Definition. In einer internationalen Li- teraturübersicht zum englischen Begriff Logistics Spacewird der logistische Raum als System von Räumen beschrieben, das aus Logistikunternehmen, Logistikknoten, Logistikinfrastruktur und Industrieunternehmen besteht (vgl. [He+18]). Der logistische Knoten, wie etwa ein Logistikzentrum oder ein Distributionzentrum, gilt als räumliches Hauptelement, das die logistischen Aktivitäten wahrnimmt. Dieser Logistikknoten beschreibt den Bereich, der in der deutschsprachigen Literatur die Domäne der Intralogistik umfasst. Wenn in dieser Arbeit vom logistischen Raum die Rede ist, dann steht die Intralogistik innerhalb eines solchen Logistikknotens im Mittelpunkt. Eine offene Fragestellung ist, wie ein logistischer Raum formal definiert werden soll, sodass wesentliche Aspekte logistischer Systeme beschrieben werden können. Ist es möglich, die Raumbegriffe anderer Disziplinen zu adaptieren, und welche Unterschiede ergeben sich aus einer vergleichenden Betrachtung? Spezifisch stellt sich diese Arbeit die Frage, ob der Raumbegriff der Ro- botik für die Logistik genutzt werden kann. Kann das Konzept des Roboters verallgemeinert aufgefasst werden, sodass es beliebige Objekte und auch den Menschen beinhaltet? 1.2 Forschungsfragen 5 Der leere Raum Der Begriff des leeren Raums kann umgangssprachlich als ein Raum aufgefasst werden, der nichts enthält. Im Gegensatz dazu enthält ein Logistiksystem eine Infrastruktur sowie physische Objekte, deren Bewegung zur logistischen Hauptaktivität gehört.Wenn der leere Raum keine Objekte enthält, dann steht dieser Zustand im Widerspruch zur Leistungserbringung des logistischen Systems, für die möglichst viele Objekte in kurzer Zeit hindurchbewegt werden müssen, also der Raum eigentlich möglichst gefüllt sein sollte. Dementsprechend kann es von Vorteil sein, den leeren Raum dynamisch zu betrachten. Die bewegten Dinge treten in den Raum ein, werden bewegt und verlassen den Raum wieder. Damit ist der leere Raum Ausgangszustand und zugleich Endzustand der logistischen Aktivität. Damit stellt sich die Frage, ob sich der leere Raum nur auf den Teil eines logistischen Systems bezieht, der für Objektbewegungen verwendet wird. In diesem Sinne kann der leere Raum als frei von Hindernissen im Sinne der Bewe- gungsplanung gedacht werden. Diese Hindernisse beinhalten offensichtlich bauliche Strukturen sowie die Infrastruktur des Logistiksystems. Zusätzlich zu diesen statischen Hindernissen kinematischer Art können dynamische Hindernisse die Freiheit einschränken. Dazu zählen Objekte und Menschen, die sich im Raum bewegen. Neben dynamischen und statischen Hindernissen kann die Bewegungs- freiheit auch durch algorithmische Strukturen eingeschränkt werden. Fest vorgegebene Fahrwege oder gitterbasierte Straßenkarten können den mögli- chen Raum für eine Objektbewegung beschränken. Insofern steht der leere Raum auch für eine größtmögliche Bewegungsfreiheit in Bezug auf die algorith- mische Ausführung der Bewegungssteuerung. Ein weiterer Aspekt ist die Mobilität der lokalen Infrastruktur selbst. Wie zu Anfang dieses Abschnitts beschrieben, ist der ideale Standort eines Lo- gistiksystems und damit der Ort des logistischen Raums nicht dauerhaft festlegbar. Jede fest verbaute Infrastruktur, wie etwa Förderbänder und fest verkabelte Automatisierungstechnik, verhindert eine einfache Verlegung des logistischen Raums. Der leere Raum steht unter diesem Aspekt für die Abwesenheit fest verbauter Infrastruktur. 6 1 Einleitung Annahmen und Vorraussetzungen Im Folgenden sollen einige grundlegende Annahmen getroffen werden, auf denen die Hypothesen dieser Arbeit aufbauen. Diese Annahmen werden an dieser Stelle der Arbeit zur besseren Nachvollziehbarkeit beschrieben. Sie gehen auf die oben beschriebenen Prinzipien der Industrie 4.0 ein und fassen wesentliche Aspekte des Grundlagenkapitels zusammen: • Der logistische Raum ist ein dezentraler, konsensfähiger Informati- onsraum. Der Zustand des logistischen Raums bestimmt sich ausschließlich durch dezentrale, lokal erfasste Beobachtungen. Diese Beobachtungsereignisse werden durch Kommunikationsvorgänge mit zeitlicher Verzögerung ag- gregiert. Je umfassender und zentraler die Aggregation geschieht, desto mehr Zeitverzögerung ergibt sich zwischen dem Abbild der Wirklichkeit und dem tatsächlichen physischen Zustand. Konsensfähigkeit bedeutet, dass es möglich ist, einen allgemein akzeptierten Zustand des Informati- onsraums zu erreichen, auf dem eine Planung von Objektbewegungen möglich wird. Die technischen Maßnahmen zur Erreichung der Konsens- fähigkeit sind Teil des Entwurfs eines logistischen Systems. • Kontinuierliche Wahrnehmung des physischen Raums Es wird in dieser Arbeit davon ausgegangen, dass eine örtlich begrenzte Wahrnehmung physischer Objekte, insbesondere die regelmäßige, in sehr kurzen Zeitabständen erfolgende Bestimmung von Position und Rotation, möglich ist. • Örtlich begrenzte Kommunikationsfähigkeit aller in physische Ob- jekte eingebetteten Computersysteme Es gibt eine grundsätzliche, technische Kommunikationsfähigkeit, die es allen eingebetteten Computersystemen erlaubt, örtlich begrenzt In- formationen auszutauschen. Diese Kommunikationsfähigkeit unterliegt technischen Beschränkungen, sodass Latenzzeiten und eine beschränkte Datenübertragungsrate berücksichtigt werden müssen. Die Übertragung von Nachrichten ist zuverlässig, sodass eine Nachricht nicht verloren gehen kann. Es wird weder von einer Einhaltung der Reihenfolge von Nachrichten ausgegangen, noch von einer garantierten Übertragungszeit. Auf Basis dieser Voraussetzungen können die Hypothesen aufgestellt werden. Es sei angemerkt, dass diese Annahmen nicht bedeuten, dass sie für darauf aufbauende Systeme und ihre Algorithmen transparent sind. Im Gegenteil beeinflussen die technischen Einschränkungen von Wahrnehmungs- und Kommunikationsfähigkeit alle weiteren Systeme und müssen zwingend berücksichtigt werden. 1.3 Hypothesen 7 1.3 Hypothesen Diese Arbeit untersucht die folgenden Hypothesen zum logistischen Raum. Dabei werden die in den Grundlagen betrachteten Themengebiete verwendet, um eine einheitliche und neue Sicht auf den Entwurf logistischer Systeme zu erarbeiten. H1. Der ideale logistische Raum ist leer, kontinuierlich und kinodyna- misch. Wenn der ideale logistische Raum leer ist, dann ist eine durch die Bewegungsplanung vorgegebene diskrete, gitterbasierte Struktur für die Leistung eines Logistiksystems nachteilig. Kontinuierliche Zustands- variablen, die Geschwindigkeit, Beschleunigung und Ruck abbilden, ermöglichen in der Praxis hohe Geschwindigkeits- und Beschleunigungs- werte. H2. Eine axiomatische Definition der Logistik ist auf Basis des Konzepts des idealen logistischen Raums möglich. Im Gegensatz zu einer Defi- nition der Logistik, die auf der Einordnung und Generalisierung von bekannten Anwendungen und Systemtypen basiert, kann eine axiomati- sche Definition auf Basis des Konzepts des logistischen Raums entwickelt werden. Eine solche Definition hat den Vorteil, auch für unbekannte, noch nicht entwickelte Technologien gültig zu sein. H3. Es gibt einen effizient durchführbaren Planungsalgorithmus für eine Vielzahl von bewegten Objekten im idealen logistischen Raum. Es kann ein effizienter, allgemeingültiger Planungsalgorithmus entwickelt werden, der für eine Vielzahl logistischer Objekte die Durchführbarkeit einer konfliktfreien Bewegung sicherstellt (im Sinne einer Feasibility, vgl. Unterabschnitt 2.4.1). H4. Eine dezentrale Steuerung logistischer Systeme auf Basis des Pla- nungsalgorithmus lässt sich mit dem Konzept des Cyberphysischen Zwillings umsetzen. Das Konzept des Digitalen Zwillings lässt sich durch Spezialisierung anpassen, um die axiomatische Definition der Lo- gistik um die Aspekte Dezentralisierung, Modularität und Skalierbarkeit zu ergänzen. H5. Ein Hochleistungssortiersystem mit klassischer Stetigfördertechnik kann durch einen Schwarm hochdynamischer Transportroboter er- setzt werden. Es kann nachgewiesen werden, dass ein Transportroboter- schwarm auf Basis des entwickelten Planungsalgorithmus die Leistung eines Hochleistungssortiersystems traditioneller Bauart erreicht. 8 1 Einleitung 1.4 Vorgehen und Struktur Dem Forschungsziel wird sich sukzessive genähert, indem zunächst die Grundlagen der Logistik sowie der theoretischen Bewegungsplanung in der Robotik beschrieben werden (Kapitel 2). Darauf aufbauend wird eine axioma- tische Definition der Logistik entwickelt, deren Kernkonzept der logistische Raum ist. Ergänzt wird das Konzept durch den Cyberphysischen Zwilling als Abstraktion dezentraler Steuerung, virtueller Abbildung und Simulation (Kapitel 3). Anschließend werden in Kapitel 4 die Anforderungen an eine Bewegungsplanung spezifiziert, existierende Arbeiten betrachtet und die Forschungslücke bestimmt. Kapitel 5 widmet sich der Verfahrensentwick- lung und Kapitel 6 der Evaluation. Kapitel 7 enthält die Zusammenfassung und den Forschungsausblick. Vorgehen Inhaltliche Bausteine Grundlagen § Klassische Logistik Grundlagen Logistik Interdisziplinäres § Cyberphysische Systeme Gesamtbild § Digitaler Zwilling Grundlagen der Grundlagen Bewegungsplanung § Theorie der Bewegungsplanung (Robotik) Neudefinition der Logistik § Axiomatik der Logistik Axiomatik der Logistik Basis für die § Cyberphysischer Zwilling Verfahrens- Cyberphysischer entwicklung Zwilling Anforderungen Anforderungs- § Anforderungen an das Verfahren spezifikation Forschungslücke § Grenzen bisheriger Bisherige Forschungsarbeiten Forschungsarbeiten Eigener Lösungsentwurf Formale Beschreibung § Entkoppelte und priorisierte der Problemstellung Bewegungsplanung § Splinebasierte Trajektorienplanung Auswahl von Bewertungsrahmen § Konfliktlösung durch parallele Methoden des Verfahrens Simulation und Anpassung von Geschwindigkeitsprofilen Algorithmen Evaluation Empirische § Testbed für Cyberphysische Untersuchungen Simulationsstudie Zwillinge § Empirische Untersuchungen Verfahrensbewertung, § Simulation großer Sortiersysteme kritische Reflexion Abb. 1.3 Vorgehen und inhaltliche Struktur der Forschungsarbeit Prüfung Verfahrensentwicklung Forschungs-lücke Axiomatik Grundlagen Kapitel 2 Grundlagen Zusammenfassung Das zweite Kapitel erläutert zunächst das Forschungs- umfeld und die terminologischen und technologischen Grundlagen dieser Arbeit, insbesondere den engen Zusammenhang zwischen den Fachbereichen der Logistik und der Robotik. Zu Beginn werden die Grundbegriffe der Lo- gistik sowie der innerbetrieblichen Materialflusssteuerung und -simulation eingeführt. Anschließend werden cyberphysische Systeme und verwandte Themenbereiche wie Dezentralisierung und Echtzeitfähigkeit beschrieben. Es wird das Paradigma des Digitalen Zwillings eingeführt. Anschließend widmet sich das Kapitel in einem umfangreichen Abschnitt der Theorie der Bewegungsplanung aus dem Fachbereich der Robotik. Neben der Pla- nung in diskreten Weltmodellen wird insbesondere auf die Planung in kon- tinuierlichen Weltmodellen unter kinodynamischen Zwangsbedingungen eingegangen. 9 10 2 Grundlagen 2.1 Logistik Die Grundbegriffe der Logistik, wie sie für den Zweck dieser Arbeit benötigt werden, stammen im Wesentlichen aus dem ersten Kapitel des Handbuch Logistik und sind hier in geeigneterWeise zusammengefasst und kommentiert (vgl. [Arn+08a]). Da diese Begriffe im Laufe der Arbeit teilweise neu definiert werden, beschränkt sich dieser Abschnitt auf die relevanten klassischen Grundbegriffe. Für eine ausführliche Erörterung der klassischen Sichtweise auf die Logistik sei auf das Handbuch oder weitere hier genannte Quellen verwiesen. Zu den Grundbegriffen gehört das Logistikobjekt, das allgemein Waren, Gü- ter, Personen oder Lebewesen bezeichnet. Logistikobjekte werden inMengen quantifiziert, die zu bestimmten Zeitpunkten an bestimmten Orten existieren (vgl. [Gud10a, S. 3]). Logistikobjekte und Orte befinden sich in einem logistischen System, in dem logistische Prozesse durchgeführt werden, die in (Orts-)Veränderungen an den Mengen über die Zeit resultieren. Ein logistisches System dient der grundlegenden Strukturierung und kann selbst wieder Subsysteme enthalten und Teil von Supersystemen sein. Die Bedeutung der Logistik kann daher sehr allgemein als Gestaltung logistischer Systeme und logistischer Prozesse definiert werden (vgl. [Arn+08a, S. 3]). Darüber hinaus sieht [Arn+08a] ein wesentliches Merkmal in der gezielten Steuerung der Prozesse, insbesondere bei der Bewegung von Objekten. Der Austausch von Informationen über die räumliche Distanz ist notwendige Voraussetzung für das Funktionieren des Systems. Jedes logistische System besitzt ein Informations- und Kommunikationssystem, dessen Gestaltung zur Logistik gehört. Ein weiteres klassisches Merkmal der Logistik ist die umfassende Betrach- tung aller Prozesse in einem System, dessen Struktur als Netzwerk aus Orten und Wegen aufgefasst wird. Die Wege bilden Verbindungslinien, über die sich Objekte bewegen. Alle Bewegungsvorgänge werden als Fluss aufgefasst, der gesteuert werden muss. Nach [Arn+08a] gilt als Besonderheit das logistische Denken bei der Gestal- tung des Netzwerks, nach dem die Abstimmung aller Prozesse im Hinblick auf das Gesamtsystemverhalten Vorrang vor der Betrachtung einzelner Pro- zesse hat. Dies erfordert zudem, dass die Grenzen eines logistischen Systems nicht zu eng gesetzt oder zu scharf gezogen werden sollten. Die klassische Literatur betont bei der Betrachtung der Logistik als Wis- senschaftsdisziplin den interdisziplären Charakter, der zum einen durch die Notwendigkeit zu einer ganzheitlichen Sichtweise begründet wird und zum anderen aus dem spezifisch physischenMerkmal der Betrachtungsgegenstän- de entsteht (vgl. [Arn+08a, S. 4]). Nach [Gud10a, S. 4] hat die Logistik den 2.1 Logistik 11 Status einer Hilfswissenschaft und ist Gegenstand der Wirtschaftswissen- schaften, der Ingenieurwissenschaften und der Informatik. Aufgaben und Ziele Die Aufgabe jedes logistischen Handelns ist die effiziente Bereitstellung der geforderten Quantitäten benötigter Materialien in der richtigen Zusammen- setzung zur rechten Zeit am richtigen Ort. Dazu werden Prozesse, Strukturen und Systeme entwickelt und organisiert [Gud10a, S. 3]. Aus der allgemeinen Aufgabenstellung der Logistik ergibt sich die all- gemeine Transportaufgabe, die sich mit der Veränderung des räumlichen Daseins von Logistikobjekten befasst (vgl. [Arn+08b], S. 393). Allgemeine Transportaufgabe „Ein Transportsystem ist so zu gestalten, zu dimensionieren, zu organi- sieren und zu disponieren, daß ein bestimmter Beförderungsbedarf unter Berücksichtigung der räumlichen, zeitlichen und technischen Randbedingungen kostenoptimal erbracht wird.“ (vgl. [Gud10b], S. 771) Nach [Gud10b] besteht das Gestalten aus dem Zusammenfügen eines Trans- portnetzes auf Basis von Transportelementen und der Auswahl geeigneter Transportmittel. Das Dimensionieren umfasst die Festlegung der Transportwe- ge in Bezug auf Lage und Länge, das Organisieren den allgemeinen Aufbau der Steuerung und das Disponieren die Strategien, nach denen Transportauf- träge durch Transportmittel ausgeführt werden. Die Definition quantitativer Ziele erfolgt in der Logistik über Kennzahlen- systeme, die hierarchisch aufgebaut sind und eine Menge an Einzelkennzah- len, die untereinander in einer Systematik verknüpft sind, zu sogenannten Spitzenkennzahlen verdichten (vgl. [Arn+08b], S. 398ff). Die Spitzenkenn- zahlen der Logistik sind • die Auftrags- und Materialdurchlaufzeit, • der Lieferservicegrad, • der Bestand, • die Umschlaghäufigkeit und • die Logistikkosten. In Bezug auf die allgemeine Transportaufgabe ist die Minimierung der Auftrags- und Materialdurchlaufzeit die grundlegende Zielsetzung. In Ab- bildung 2.1 wird der Zusammenhang zwischen Auftragsabwicklung und Lieferzeit veranschaulicht. 12 2 Grundlagen Eingang Disposition Versand Empfang Materialdurchlaufzeiten Auftragsdurchlaufzeit Lieferzeit Abb. 2.1 Zusammenhang von Lieferzeit, Auftragsdurchlaufzeit und Materialdurchlaufzeiten Die Auftrags- und Materialdurchlaufzeiten beeinflussen direkt den Lieferser- vicegrad und haben indirekt Einfluss auf den Bestand und die Umschlaghäu- figkeit. Leistung Für den allgemeinen Leistungsbegriff in logistischen Systemen sei auf [Arn+08b] verwiesen. Die quantitative Leistung eines Transportsystems ist durch die Anzahl an Aufträgen gekennzeichnet, die über einen begrenz- ten Zeitraum erfolgreich ausgeführt werden. Der Erfolg wird dabei durch Randbedingungen wie die Einhaltung eines Liefertermins zur Erhöhung des Lieferservicegrads beeinflusst. Eine qualitative Leistung kann über die erfolgreiche Erbringung eines im Voraus vorgegebenen Beförderungsbedarfs definiert werden. Die maximal mögliche Leistung eines Systems, auch Grenz- leistung genannt, sollte den maximal erforderlichen Beförderungsbedarf erreichen oder übertreffen. Generell gilt für klassische Logistiksysteme, dass eine hohe Leistung mit einem erhöhten Bedarf an Fläche und Transportmitteln sowie mit einem hohen Automatisierungsgrad verbunden ist. Die klassischen Systeme mit den höchsten Leistungen zeichnen sich durch eine vollautomatisierte, fest verbaute Infrastruktur aus (siehe in Abschnitt 2.1 das Beispiel der Sortiersys- teme). Kosten Die betriebswirtschaftliche Betrachtung der anteiligen Logistikkosten wird über alle logistikrelevanten Kostenstellen abgebildet, die z. B. Disposition, Einkauf und den innerbetrieblichen Transport umfassen und anfallende Kos- tenarten im Bereich der laufenden Personal-, Betriebsmittel- und Raumkosten berücksichtigen (vgl. [Arn+08b], S. 398ff). 2.1 Logistik 13 Die Investitionskosten eines Transportsystems werden maßgeblich vom maximalen Beförderungsbedarf bestimmt, der den Flächenbedarf sowie die Anzahl Transportmittel und -elemente beeinflusst, die zur Erreichung der notwendigen Grenzleistung dienen. Ändert sich der Beförderungsbedarf, so entstehen Kosten für Umbau und Erweiterung. Effizienz Ein Logistiksystem ist effizient, wenn es seine Anforderungen zu den ge- ringstmöglichen Kosten erfüllt. Im Fall eines vollautomatisierten Transport- systems für hohe Leistungen bedeutet dies, dass die kostenbestimmende Grenzleistung möglichst genau den Beförderungsbedarf abbilden sollte. Die Herausforderung bei der Gestaltung von Transportsystemen ist, diesen op- timalen Betriebspunkt höchster Effizienz über einen möglichst langen Zeit- raum zu treffen. Dies erfordert bei sich änderndem Beförderungsbedarf eine Flexibilität, die bei vollautomatisierten Systemen mit fest verbauter In- frastruktur schwierig umzusetzen ist. Aus dieser Problemstellung heraus entsteht die Forderung nach wandelbaren Systemen. Wandlungsfähigkeit und Flexibilität Der Begriff der Wandlungsfähigkeit stammt aus dem Bereich der Produkti- onssysteme, kann aber auch gut auf Logistiksysteme angewendet werden. Nach [Nyh10] kann ein System umso schneller und günstiger verändert werden, je wandlungsfähiger es ist. Diese Wandlungsfähigkeit ermöglicht eine investitionsgetriebene Anpassung sogenannter Flexibilitätskorridore, innerhalb derer das System im Regelbetrieb auf unterschiedliche Anforde- rungen reagieren kann. Die Anforderungen können sich auf verschiedene Dimensionen wie z. B. Stückzahl-, Technologie- oder Produktveränderungen beziehen. Wie genau die Wandlungsfähigkeit eines Systems umgesetzt wird, fasst [Lan+18, S. 9] zusammen. Es sind Eigenschaften des Systems, die sich auf die individuellen Eigenschaften der physisch enthaltenen Objekte beziehen: • Kompatibilität Definierte Schnittstellen ermöglichen die aufwandsarme Integration von Objekten oder Prozessen in das System. • Mobilität Objekte können sich lokal uneingeschränkt bewegen. • Modularität Das System und seine Objekte bestehen aus standardisierten, voll funkti- onsfähigen Einheiten. • Skalierbarkeit Ein System ist auf Veränderungen der Anzahl an vorhandenen Objekten 14 2 Grundlagen innerhalb seiner technischen, räumlichen und organisatorischen Dimen- sionen vorbereitet. • Universalität Ein System kann für unterschiedliche Anforderungen verschiedener Ob- jekttypen dimensioniert und gestaltet werden. Nach [Lan+18] werden diese Eigenschaften für Produktionssysteme bislang vor allem auf die physische Beschaffenheit der Objekte bezogen, während die digitalen Aspekte noch nicht im Fokus stehen. Beispiel Sortiersysteme Von besonderer Bedeutung sind in dieser Arbeit die Sortiersysteme, da sie als Anwendungsbeispiel für den Einsatz hochleistungfähiger Cyberphysischer Zwillinge im Kapitel der Validierung betrachtet werden. Nach [Ver83] hat die Sortierung in logistischen Systemen das Ziel, logistische Objekte nach bestimmten Kriterien auf Zielorte zu verteilen. Ein Sortiersystem kann als Subsystem betrachtet werden, dessen Grenzen durch Einschleusbereiche und Ausschleusbereiche gekennzeichnet ist. Über die Einschleusbereiche wird ein ungeordneter Objektstrom in das System eingeleitet, dessen Einzelob- jekte individuell identifiziert werden, um anschließend zum bestimmten Ziel transportiert zu werden. Einen guten Überblick über Sortiersysteme im Allgemeinen geben [BJ19] und [Jt12]. Für die Leistungsberechnung kann [Sem15] zu Rate gezogen werden. Ein wichtiger Einsatzbereich von Sortiersystemen sind die Verteilzentren von Kurier-, Express- und Paketdiensten (KEP). Hier finden sich Anlagen im Hochleistungsbereich in Einsatz, die von 10.000 Paketen pro Stunde bis hin zu 400.000 Paketen pro Stunde sortieren können (vgl. [BJ19, S. 153]). Linie Loop (a) (b) Abb. 2.2 Sortertopologien nach [BJ19, S. 161] Hochleistungssortiersysteme sind bislang eine Domäne der Stetigfördersys- teme und werden üblicherweise anhand ihrer Topologie klassifiziert. Die Linientopologie ist in Abbildung 2.2a dargestellt und wird unter Verwen- dung von Platten-, Stahl- oder Plastikbändern als Tragmittel ausgeführt. Bei der Schleifentopologie (engl. loop), die in Abbildung 2.2b dargestellt ist, 2.1 Logistik 15 werden in der Regel segmentierte Tragmittel verwendet, wie etwa beim Kippschalensorter oder beim Quergurtsorter (vgl. [BJ19, S. 160]). Ein dezentral gesteuertes Sortiersystem, der GridSorter, ermöglicht ei- ne mittlere Sortierleistung von 3.000 bis 10.000 Objekten pro Stunde (vgl. [Fle21]). Steuerung eines logistischen Systems Nach DIN 19233 bezeichnet der Begriff der Steuerung einen „[. . . ] Vorgang in einem System, bei dem eine oder mehrere Größen als Eingangsgrößen ande- re Größen als Ausgangsgrößen aufgrund der dem System eigentümlichen Gesetzmäßigkeiten beeinflussen“ (vgl. [Deu98]). Von außen betrachtet sind für logistische Systeme die Eingangsgrößen die Eintrittszeitpunkte und -orte logistischer Objekte in das System sowie die zugehörigen Zielinformationen gegeben. Die Ausgangsgrößen setzen sich durch Austrittszeitpunkte, -orte und Verweildauern zusammen. Die dem logistischen System eigentümlichen Gesetzmäßigkeiten sind durch seine technischen, räumlichen und organisatorischen Bedingungen bestimmt. Von innen betrachtet ist ein logistisches System eine Mehrebenensteue- rung, wie sie auch aus der Regelungstechnik bekannt ist (siehe Abbildung 2.3, vgl. [Lun10, S. 3]) Abb. 2.3Mehrebenensteuerung der Regelungstechnik nach [Lun10] Dabei wird der Begriff des dynamischen Systems verwendet, dessen Dynamik sich in der zeitlichen Änderung seiner wichtigsten Kenngrößen ausdrückt. Dabei können sowohl technische Anlagen als auch Lebewesen als dyna- mische Systeme aufgefasst werden. Ein dynamischer Prozess bezeichnet die Veränderungen, die sich innerhalb des dynamischen Systems abspielen. Über eine zielgerichtete Beeinflussung wird das System gesteuert (vgl. [Lun10, S. 2]). 16 2 Grundlagen Bei der Mehrebenensteuerung, wie sie in Abbildung 2.3 gezeigt ist, un- terscheiden sich die einzelnen Ebenen in der Art der zeitlichen Betrachtung. Auf der untersten Ebene befinden sich die sogenannten Regler, die das dy- namische System direkt beeinflussen. Jeder Regler i beeinflusst über eine Stellgröße ui das dynamische System so, dass ein auf einer Führungsgröße wi basierendes Regelziel verfolgt wird, dessen Erreichung über die Mess- größe yi beobachtet werden kann. Dieser Regelvorgang erfolgt kontinuierlich oder quasi-kontinuierlich, d. h. in sehr kurzen Zeitintervallen. Regler und dynamisches System stehen in ständiger Wechselwirkung und bilden einen geschlossenen Wirkungskreis, den sogenannten Regelkreis. Diese unterste Ebene der Steuerung wird Regelung genannt und ist Gegenstand der Rege- lungstechnik (vgl. [Lun10, S. 3])). Abb. 2.4 Grundstruktur eines Regelkreises nach [Lun10, S. 4] Ein weiterer wichtiger Begriff ist die Regelstrecke, die zur Grundstruktur eines Regelkreises gehört (siehe Abbildung 2.4). Sie bezeichnet den Teil des dynamischen Systems, der von einem einzelnen Regler innerhalb eines geschlossenen Wirkungskreises kontrolliert wird. Über e(t) = w(t) − y(t) kann die Regelabweichung bestimmt werden, in deren Abhängigkeit der Regler unter Berücksichtigung der „eigentümlichen Gesetzmäßigkeiten“ der Regelstrecke und einer eventuellen äußeren Störgröße d(t) die Stellgröße y(t) beeinflussen wird. In einem logistischen System betrifft die Regelung die lokal begrenzte Ortsveränderung logistischer Objekte, insofern kann hier der Begriff der Regelstrecke fast wörtlich genommen werden. In [Lun10, S. 7] wird ein lo- gistisches Beispiel für einen manuellen Regelkreis gegeben. Dort ist der Kranführer eines Portalkrans der Regler, der die Bewegung der Laufkatze be- einflusst, an der ein Objekt an einem Seil hängt. Dabei ist neben der gezielten Transportbewegung eine zusätzliche Zielvorgabe, dass das Objekt nicht in Schwingung gebracht werden soll. Der Kranführer besitzt ein aus Erfahrung gelerntes,mentales Modell der Regelstrecke, die aus Laufkatze, Seil und Objekt besteht. Durch kontinuierliche Beobachtung aus seiner Kabine heraus kann er die Transportbewegung ohne Schwingung über Änderung der Beschleuni- gung der Laufkatze steuern. Als zusätzliche Störgröße beeinflusst der Wind die Schwingung des Objekts. 2.1 Logistik 17 Ein Beispiel für Regelung in einem automatisierten Logistiksystem ist die Einschleusung von Paketen auf einen Kippschalensorter (siehe Abschnitt Sor- tiersysteme). Hier ist die Messgröße die Belegung der Kippschalen, die sich auf die Einschleusung zubewegen. Das Regelungsziel ist die Bewegung eines Pakets derart, dass es sicher auf einer freien Schale zu liegen kommt. Die Regeleinrichtung besteht aus einem Computer, dessen Programm auf einem mathematischenModell der Regelstrecke beruht undmit Sensoren und Aktoren verbunden ist. Die Beobachtungsfähigkeit ist auf die Messung einer Licht- schranke beschränkt, die sich vor der eigentlichen Einschleusung befindet. Teil des Modells ist das Wissen über die Geschwindigkeit des Sortiersystems, sodass berechnet werden kann, wann genau sich eine leere Kippschale vor der Einschleusung befindet. Die Stellgröße ist die Bewegung eines Förderban- des, dessen Krafteinwirkung das Paket so beschleunigt, dass es im richtigen Moment auf die Kippschale rutscht. Teil der technischen Ausführung der Regelstrecke sind Hilfsmittel für die Geschlossenheit des Wirkungskreises: Mechanische Zwangsbedingungen, die über Leitplanken realisiert werden, si- chern die Bewegung des Pakets so ab, dass es innerhalb der Regelstrecke bleibt. Die Besonderheit bei einem logistischen System ist, dass die elementaren Regeleinrichtungen zueinander in räumlicher Beziehung stehen. Jeder Regler hat Nachbarn, mit denen er im Austausch steht. Dabei kann für die Logistik zwischen zwei Fällen unterschieden werden: • Der Regler hat einen festen Ort und steuert lokal beschränkt die Be- wegung logistischer Objekte in seinemWirkungsbereich. In diesem Fall bilden die Regeleinrichtungen die Knoten und/oder Kan- ten des logistischen Netzwerks ab. Die logistischen Objekte werden von demWirkungsbereich des einen Reglers zumWirkungsbereich des nächs- ten Reglers bewegt. Dieser Fall wird in der Logistik mit dem Begriff der Stetigfördertechnik bezeichnet, der sich auf den stetigen Objektfluss be- zieht. Ein klassisches Beispiel ist ein System aus Förderbändern. • Der Regler bewegt sich zusammen mit einem logistischen Objekt durch das Gesamtsystem. Hier ist die Regeleinrichtung Teil eines logistischen Objekts, das sich zusammen mit einem oder mehreren logistischen Objekten durch das System bewegt. Die Knoten und Kanten des logistischen Netzes sind hier als Straßen und Kreuzungen zu verstehen. Ein Beispiel ist ein Ga- belstapler, der eine Palette transportiert. Dieser Fall wird in der Logistik Unstetigfördertechnik genannt. Die höheren Ebenen bei einer Mehrebenensteuerung der Regelungstech- nik haben einen längeren Betrachtungszeitraum und betrachten das offene Gesamtsystem. Dabei haben Planung und Optimierung eine koordinieren- 18 2 Grundlagen de Funktion bezüglich der hierarchisch tieferstehenden Regler (siehe Ab- bildung 2.3). Grundsätzlich gilt: Je höher die Hierarchieebene, desto län- gerfristiger und komplexer werden die Steuerungsaufgaben (vgl. [Lun10, S. 3]). Für automatisierte Logistiksysteme klassischer Bauart definiert das VDMA-Einheitsblatt 15276 Datenschnittstellen in Materialflusssystemen ein Steuerungsmodell, das auf Ebenen basiert (vgl. [Ver94]). Das Modell der Regelungstechnik wird um die Bedeutung der Topologie des Systems er- gänzt. So entsprechen die beiden untersten Ebenen Antriebe und Geber und Elementsteuerung im Prinzip der Reglerebene, jedoch ist hier schon sprach- lich angedeutet, dass es sich um lokal beschränkte, elementare, einander ausschließende Wirkungsbereiche handelt. Die höheren Ebenen erweitern die räumliche Zuständigkeit sukzessive von der Bereichssteuerung über die Subsystemsteuerung bis hin zur Systemsteuerung. Simulation logistischer Systeme Nach [Ver10] wird unter dem Begriff der Simulation allgemein „[. . . ] ein Verfahren zur Nachbildung eines Systems mit seinen dynamischen Prozessen in einem experimentierbaren Modell, um zu Erkenntnissen zu gelangen, die auf die Wirklichkeit übertragbar sind“ verstanden. Dabei werden „Prozesse (Zustandsfolgen in der Zeit) endogen aufgrund der im Modell dargestellten Wirkzusammenhänge und Zeitmechanismen entwickelt“ (vgl. [SK90, S. 437]). Eine ausführliche Betrachtung der klassischen Simulation logistischer Sys- teme findet sich in [Wen18]. Ein Anwendungsbeispiel ist der Einsatz während der Planungphase mit dem Ziel, einen Sicherheitsgewinn, Lösungsverbes- serungen und ganz allgemein ein Systemverständnis zu gewinnen, so dass insgesamt ein günstigerer Anlagenbetrieb ermöglicht wird. Die Simulation kann quantifizierbare Charakteristiken verschiedener Lösungsvarianten für ein System liefern und somit die Entscheidungsfindung bei der Planung unterstützen. Im Gegensatz zu mathematisch-analytischen Methoden hat die Simulation den methodischen Vorteil, dass nahezu beliebig komplexe Sachzusammenhänge über die schrittweise Entwicklung von Zustandsfolgen über die Zeit abgebildet werden können (vgl. [Wen18, S. 4ff]). Zeitmechanismen Ein wichtiges Unterscheidungsmerkmal bei Simulationsmethoden sind die verwendeten Zeitmechanismen. Die Abbildung des Zeitverlaufs innerhalb der Simulation geschieht über eine sogenannte Simulationsuhr und wird Simulationszeit genannt. Wenn die Simulation rechnergestützt über ein Simu- lationsprogramm durchgeführt wird, dann kann diese Simulationsuhr durch verschiedene Mechanismen gesteuert werden. Bei einer Simulation mit kontinuierlichem Zeitverhalten wird das Systemver- halten durch eine Menge gekoppelter Differenzialgleichungen beschrieben, 2.2 Cyberphysische Systeme 19 sodass die abhängigen Variablen in einem stetigen Verlauf über die Zeit abgebildet werden (vgl. [Wen18, S. 10ff]). Im Gegensatz dazu stehen zeitdiskrete Methoden, bei denen die Simula- tionsuhr von Zeitpunkt zu Zeitpunkt springt. Dies geschieht bei der ereig- nisdiskreten Simulation auf Basis von Ereignissen, deren Eintrittszeitpunkte vorberechnet und in einer zentralen Ereignisliste sortiert werden, sodass bei Ablauf der Simulation die korrekte Vorher-Nacher-Beziehung zwischen Ereignissen eingehalten wird. Im Rahmen dieser Arbeit hat ein weiterer möglicher Zeitmechanismus eine wichtige Bedeutung: Bei der quasikontinuierlichen Simulation erfolgt der Zeit- fortschritt diskret in kurzen, vorher festgelegten Zeitintervallen. Je kleiner das Zeitintervall festgelegt wird, desto näher ergibt sich eine Abbildung der kontinuierlichen Simulation. Während die meisten am Markt verfügbaren Materialflusssimulatoren den Zeitmechanismus der diskreten ereignisori- entierten Simulation verwenden, basieren Simulatoren für geschlossene Re- gelkreise häufig auf quasikontinuierlichen Abbildungen des Zeitfortschritts (vgl. [Dan14, S. 33]). 2.2 Cyberphysische Systeme Cyberphysische Systeme (CPS) sind Systeme, die sowohl aus Rechen- und Kommunikationseinheiten als auch aus physischen Komponenten bestehen. Ein CPS besteht aus einer Sammlung von Computersystemen, die mitein- ander kommunizieren und über Sensoren und Aktoren in einem rückge- koppelten Regelkreis mit der physischen Welt interagieren (vgl. [Alu15]). Sie kombinieren daher Rechen- und Kommunikationsfunktionen mit der Überwachung und Steuerung von Anlagen im physischen Bereich. Eine Entität im CPS besteht aus mehreren Komponenten, die wie folgt klassifiziert werden können: die steuernde Cyberkomponente, die physische Komponente und der Kommunikationskanal zwischen beiden. Die Cyber- komponente besteht aus Hardware, Software und einer Datenschnittstelle, die mit einemNetzwerk und häufigmit der Internet-Infrastruktur verbunden ist. Zu den physischen Komponenten gehören Sensoren und Aktoren. Die Kommunikationskanäle dienen der Übertragung von Daten aus der physi- schen Umgebung des CPS an die Cyberkomponente und von Befehlen von der Cyberkomponente an die Sensoren und Aktoren (vgl. [NWW21]). Da es sich um Echtzeitsysteme handelt, haben einige dieser Systeme stren- ge Anforderungen an die Dienstgüte (Qualtiy of Service, QoS). Aus diesem Grund werden CPS manchmal auch als sicherheitskritische Systeme bezeich- net. Die in der Literatur häufig erwähnten Anwendungen von CPS erstrecken sich über mehrere Bereiche, darunter z. B. Kraftwerke, Strom- und Wasser- versorgung, Verkehrssysteme sowie Systeme im Öl- und Gassektor (vgl. [NWW21]). 20 2 Grundlagen CPS können sowohl auf synchrone als auch auf asynchrone Weise für gleichzeitige Berechnungen modelliert werden, sie können in kontinuier- licher Zeit für dynamische Systeme modelliert werden, oder sie können diskrete und kontinuierliche Zeitmodelle als Hybridsysteme kombinieren (vgl. [Alu15]). CPS als wissenschaftliches Thema stützt sich auf eine Vielzahl von Teil- disziplinen, darunter modellbasierter Entwurf, Nebenläufigkeitstheorie, ver- teilte Algorithmen, formale Methoden der Spezifikation und Verifikation, Kontrolltheorie, Echtzeitsysteme und hybride Systeme. Zu den Themen gehören Sicherheits- und Liveness-Anforderungen, temporale Logik, Mo- dellprüfung, deduktive Verifikation, Stabilitätsanalyse linearer Systeme und Echtzeit-Scheduling-Algorithmen. Repräsentative Entwurfsprobleme stam- men aus den Bereichen verteilte Algorithmen, Netzwerkprotokolle, Steue- rungsentwurf und Robotik (vgl. [Alu15]). CPS als verteilte Systeme mit gemeinsamem Informationsraum Ein CPS kann als verteiltes System mit vielen Entitäten konzeptioniert wer- den. In diesem Fall besteht die Rolle der Cyberkomponente einer Entität zusätzlich darin, dass sie eine Koordination mit anderen Entitäten durch- führt. Der Fokus liegt auf der Schaffung eines gemeinsamen Informations- raums, der als Basis für die Koordination dient. Die technische Umsetzung des Informationsraums kann auf verschiedene Arten, zentral oder dezentral, ausgeführt sein. In der vollständig dezentralen Ausführung ist der Informa- tionsraum virtuell über alle Entitäten des CPS verteilt und die Koordination wird dementsprechend dezentral durchgeführt. Verteilte CPS in Transportsystemen In der Logistik besteht ein CPS aus intelligenten Logistikobjekten, die über eine eigene Cyberkomponente verfügen. Die Transportaufgabe wird gelöst, indem die Bewegungen der Objekte durch eine dezentrale Koordination unter den Entitäten des CPS abgestimmt werden. Bei dieser Abstimmung ist die Fragestellung nach der zeitabhängigen Belegung des Raums durch die Logistikobjekte zu klären, sodass ein konfliktfreier Transport vieler Objekte möglich ist. Dies erfordert ein gemeinsam akzeptiertes Abbild des physischen Raums und einen Mechanismus, der jeden Konfliktfall eindeutig löst. Dezentrale Koordination und Konsens Die Grundlage jeder dezentralen Koordination von Entitäten in verteilten CPS bildet das gezielte Zusammenführen und Verteilen von notwendigen Informationen. Damit ein CPS ein konsistentes Gesamtverhalten zeigt, be- nötigt es ein Verfahren um sicherzustellen, dass alle Entitäten, die an einer Entscheidungssituation beteiligt sind, ihre indviduellen Entscheidungen aus derselben Wissensbasis ableiten. Mit dem Begriff des Konsenswird bei verteil- 2.2 Cyberphysische Systeme 21 ten Systemen ein grundlegender Systemzustand bezeichnet, bei dem sich alle betroffenen Enitäten auf eine gemeinsame Informationsbasis geeinigt haben (vgl. [Bod+20]). Diese gemeinsame Basis kann als Informationsraum bezeich- net werden. Es gibt zwei Hauptfehler, die bei der dezentralen Koordination auftreten können: • Absturz Dieser Fehler kann aufgrund von Hardware- und Softwareschäden an einer Entität auftreten. Ein Konsensverfahren sollte robust genug sein, um abgestürzte Knoten unabhängig zu behandeln und zu reparieren, ohne den Betrieb anderer Knoten zu beeinträchtigen. • Byzantinische Fehler Ein byzantinischer Fehler wird durch eine böswillige Entität erzeugt, die absichtlich gefälschte Nachrichten weiterleitet, um das normale Funktio- nieren des CPS zu stören. Ein Konsensverfahren sollte in der Lage sein, byzantinische Entitäten im Netz zu erkennen und unter Quarantäne zu stellen. In Bezug auf diese Arbeit ist insbesondere die Robustheit gegenüber Abstür- zen, die im Fall einer zentralen Entscheidungsinstanz einen vollständigen Ausfall des Systems bewirken, von Bedeutung. Dazu ist ein autonomes Ver- halten zur Verhinderung eines führungslosen Systemzustands notwendig. Zusätzlich ermöglicht die erfolgreiche Umsetzung einer solchen autonomen Selbstkonfiguration der Führungsrolle bei verteilten Entitäten eine automati- sierte Skalierbarkeit und eine aufwandsarme Inbetriebnahme. Vollständig dezentrale Anführerwahl An einem klassischen Verfahren der vollständig dezentralen Koordination soll eine Fähigkeit demonstriert werden, mit der autonom eine temporär zentrale Führungsentität bestimmt werden kann. Mit der Methode lässt sich eine Robustheit gegenüber Abstürzen erreichen. Gleichzeitig stellt sie eine Möglichkeit dar, die in bestimmten Fällen notwendige zentrale Koordination innerhalb eines dezentral verteilten Systems bereitzustellen. Das Ziel des Verfahrens ist die Wahl einer Führungsentität. Sollte die Entität abstürzen oder von einem Teil des Netzwerks getrennt werden, können die Entitäten im führungslosen Teil des Netzwerks autonom eine neue Führungsinstanz wählen. Das Verfahren der Anführerwahl (engl. leader election) beschreibt ein Kon- sensverfahren, bei dem vollständig dezentral eine Entität bestimmt wird, die von allen anderen als führend akzeptiert wird. In [Alu15, S. 60ff] wird ein Lösungsalgorithmus für synchrone Netzwerke beschrieben, der durch das Fluten von Nachrichten zwischen den Entitäten diejenige mit der höchsten Identitätsnummer als Anführer bestimmt. Damit die Suche nach der höchsten 22 2 Grundlagen Nummer sicher nach einer endlichen Anzahl von synchronen Übetragungs- runden beendet werden kann, muss die maximale Anzahl an Elementen im Netzwerk bekannt sein. Für den asynchronen Fall wird in [Alu15, S. 163ff] ein Algorithmus beschrieben, der ohne explizite Kommunikationsrunden auskommt und weniger Nachrichten verschickt. Das Verfahren der Anführerwahl ist von besonderer Bedeutung in de- zentralen CPS, da es die Vorteile der Robustheit gegenüber Abstürzen mit der Effizienz einer zentralen Steuerung verbindet. Diese Vorgehensweise bietet sich für zeitkritische Anwendungen an, bei denen eine vorhersehbare Reaktionszeit erforderlich ist. Echtzeitfähigkeit in CPS mit Transportaufgaben Der Begriff der Echtzeitfähigkeit beschreibt die Eigenschaft eines Systems, das auf äußere Ereignisse in vorbestimmter Zeit reagieren kann. In ein- zelnen Computersystemen wird diese Fähigkeit durch das Verhalten von Algorithmen bestimmt, die unter den Beschränkungen der Hardware des Laufzeitsystems in vorbestimmter Zeit ein Ergebnis liefern (vgl. [But11]). In verteilten Systemen, in denen die Reaktion von einer Abstimmung unter den betroffenen Entitäten abhängt, wird die Echtzeitfähigkeit zusätzlich vom Kommunikationssystem und den Übetragungsprotokollen beeinflusst. Im Fall von Transportsystemen besteht die Systemreaktion aus zwei Kom- ponenten: der Bewegungsplanung und ihrer Ausführung im physischen Raum. Je nach Verfahren handelt es sich bei dem übergeordneten Prozess um eine alternierende Sequenz von Teilplanungsprozessen und physischen Teilbewegungen. Ein vollständig echtzeitfähiges Transportsystem garantiert eine vorbestimmte Ankunftszeit für einen Auftrag. Die Herausforderung ist die Abstimmung der Bewegung zwischen vielen gleichzeitigen Aufträgen. Wenn ein Transportsystem als CPS ausgelegt ist, wird diese Abstimmung dezentral koordiniert. Damit hängt die Echtzeitfähigkeit von einem Konsens- verfahren ab, dessen Informationsraum eine allgemein akzeptierte dynami- sche Belegung des Raums repräsentiert. 2.3 Digitaler Zwilling Das Konzept des Digitalen Zwillings ist eng verwandt mit dem des CPS. Auch hier stehen drei grundlegende Konzepte im Mittelpunkt: das phy- sische Objekt, das virtuelle Objekt und die Datenschnittstelle dazwischen. Hinzu kommt der Wunsch, eine Ununterscheidbarkeit zwischen physischer und virtueller Welt herzustellen, also eine dauerhafte Zwillingseigenschaft der Objekte durch Datenaustausch zu gewährleisten. Eine abstrahierte und gleichzeitig relevante Abbildung des einzelnen Verhaltens aller physischen Objekte deckt sich mit der Absicht der Simulation, die technischen Vorteile einer virtuellen Welt für die Verbesserung der physischen Welt einzusetzen. 2.3 Digitaler Zwilling 23 Hinter dem virtuellen Objekt eines Digitalen Zwillings steht ein datenge- triebenes Modell, das durch ein axiomatisches System der Anwendungsdo- mäne definiert ist. Die abstrahierten Eigenschaften der physischen Entität werden über die Datenschnittstelle und durch die sprachlichen Begriffe der Axiomatik in Relation gesetzt. Die Semantik eines Digitalen Zwillings liegt zum einen in der intrinsischen Bedeutung der Axiome, mit denen die defi- nierten Begriffe zueinander in Beziehung gesetzt werden, und zum anderen in der Interpretation des Metamodells der Daten, die über Sensoren bereitge- stellt werden. Hauptaufgabe des Digitalen Zwillings Die Hauptaufgabe des Digitalen Zwillings ist der automatisierte Ab- gleich des Zustands eines physischen Objekts mit seinem virtuellen Abbild. Der Abgleich der Zustände muss eine Qualität erreichen, die eine Anwendung der Ergebnisse von Experimenten am virtuellen Ob- jekt auf das physische Objekt direkt und automatisiert ermöglichen. Aus der Bedingung des automatisierten gegenseitigen Abgleichs der Zu- stände folgt, dass ein Digitaler Zwilling zwei Computersysteme beinhaltet. Das erste System ist im physischen Objekt eingebettet und bildet ein CPS. Es besitzt ein oder mehrere technische Verfahren zur Beobachtung sowie die Fähigkeit zur Kommunikation. Auf dem zweiten Computersystem wird das virtuelle Objekt als digitales Abbild des physischen Objekts ausgeführt. Das eingebettete Computersystem wird als ressourcenbeschränkt angenom- men, während das Computerystem, in dem das virtuelle Objekt läuft, ohne Beschränkungen gedacht ist. In Abbildung 2.5 ist der Aufbau eines Digitalen Zwillings skizziert. Auf der linken Seite ist das physische Objekt als Entität in einem verteilten CPS abgebildet. Auf der rechten Seite ist das laufend aktualisierte virtuelle Abbild dargestellt (a), aus dem für die Durchführung von Experimenten eine Kopie erstellt wird (b). Die Trennung zwischen Abbild und Kopie ist notwendig, da alle Änderungen am Abbild direkt zu Änderungen am physischen Objekt führen. Durch den vollständigen Wegfall der manuellen Datenübertragung wird insbesondere die Gestaltung des Datenempfangs am physischen Objekt rele- vant. Für das physische Objekt in einem Digitalen Zwilling gelten folgende Bedingungen: • Daten des virtuellen Objekts müssen am physischen Objekt automatisiert empfangen und verarbeitet werden können. Es ist immer ein CPS oder eine Entität in einem verteilten CPS. 24 2 Grundlagen Abb. 2.5 Grundstruktur des Digitalen Zwillings • Ein physisches Objekt kann nur dann Teil eines Digitalen Zwillings sein, wenn es durch einen technischen Apparat oder ein Verfahren als trennba- res Einzelstück erkennbar ist. • Das erkannte physische Objekt muss eindeutig identifizierbar sein, damit die Daten dem richtigen virtuellen Zielobjekt zugeordnet werden können. Digitale Zwillinge können in ihrer Größe und Komplexität sehr unterschied- lich sein, das ist im Prinzip durch die sehr allgemein gefasste Metapher vorgegeben. Einen guten Überblick über mögliche Anwendungsfälle gibt [Kri+18]. Digitale Zwillinge in der Logistik Die Synchronisierung von Material- und Informationsfluss ist eine der Auf- gaben eines logistischen Systems und legt eine Anwendung des Konzepts des Digitalen Zwillings nahe. Dazu kommt, dass die Bedingung der Identifi- zierbarkeit für physische Objekte in der Logistik vorausgesetzt wird. Jedes physische Objekt wird im Rahmen von Logistikprozessen eindeutig identi- fizierbar gemacht. Dabei kann es als Einzelstück getrennt von anderen Ob- jekten behandelt und über die Verwendung von identifizierbaren Behältern, Ladehilfsmitteln oder Verpackungen mit anderen Objekten zusammenge- fasst werden. Der Digitale Zwilling ist in diesem Sinne eine konsequente Weiterentwicklung der allgemeinen Digitalisierung logistischer Prozesse. Ganz allgemein gilt: Immer dann, wenn ein physisches Objekt koordiniert bewegt wird, handelt es sich um einen logistischen Prozess. Dieser Umstand macht die Logistik zu einer Kernanwendung des Digitalen Zwillings. Digitale Zwillinge mit kontinuierlicher Wahrnehmunsgfähigkeit Digitale Zwillinge lassen sich im Weiteren durch ihre Wahrnehmungsfä- higkeit bezüglich der Innen- und der Außenwelt unterscheiden. In Abbil- 2.3 Digitaler Zwilling 25 dung 2.6 werden Digitale Zwillinge in verschiedenen Skalierungen darge- stellt, die ihren Innenraum beobachten. In Abbildung 2.6a ist dies ein größerer Raum, wie etwa eine Halle, die Menschen und physische Objekte enthält. Abb. 2.6 Digitaler Zwilling und Räume in verschiedenen Skalierungen In Abbildung 2.6b beobachtet ein Behälter seinen Innenraum. In beiden Fäl- len führt die Beobachtung von Veränderungen im Innenraum des physischen Objekts zu einer Erzeugung von Veränderungsereignissen in der virtuel- len Welt. Die Objekte (oder Menschen) sind in diesem Fall keine Digitalen Zwillinge, sondern Teil des übergeordneten Systemzustands. Abb. 2.7 Digitaler Zwilling eines Roboters In Abbildung 2.7 wird ein mobiler Roboter als Digitaler Zwilling dargestellt, der seine äußere Umgebung beobachtet. Er verändert aufgrund dieser Be- obachtungen seinen inneren Zustand, der zum virtuellen Objekt übertragen wird. 26 2 Grundlagen 2.4 Planung und Verwaltung von Objektbewegungen Der Kern dieser Arbeit befasst sich mit der Planung und Verwaltung von Objektbewegungen in der Logistik. Dazu werden die theoretischen Grund- lagen der Bewegungsplanung aus der Robotik betrachtet, insbesondere das Konzept des Konfigurationsraums für diskrete und kontinuierliche Weltmo- delle. Ein besonderer Fokus liegt auf den Grundlagen und dem Stand der Forschung für die Bewegungsplanung in Multi-Robotersystemen, da diese für logistische Anwendungen von besonderer Bedeutung sind. Konflikte bei der Bewegung mehrerer Objekte Konflikte bei der Bewegung zwischen physischen Objekten werden in der Robotik und bei Fahrerlosen Transportsystemen seit langem untersucht (vgl. [JY94]). Sie können immer dann entstehen, wenn gezielte Bewegungen meh- rerer Objekte koordiniert werden müssen. Kollisionen Kollisionen sind der grundlegende Konflikttyp bei der Bewegung mehrerer Objekte, dessen Auflösung durch Vermeidung ursächlich für alle anderen Konflikttypen ist. Kollisionen können immer dann entstehen, wenn sich zwei Objekte zur gleichen Zeit in den gleichen Ort hineinbewegen. Dabei lassen sich punktuelle Kollisionen, wie sie in Abbildung 2.8 dargestellt sind, identifizieren, die sich durch einen örtlich begrenzten Kollisionsbereich aus- zeichnen. Dies kann der Kreuzungspunkt zweier Bahnkurven sein (siehe Abbildung 2.8a) oder ein Berührungspunkt der Hüllkurven zweier Objekte (siehe Abbildung 2.8b). t‘ t‘ t‘ (a) (b) Abb. 2.8 (a) Kollision durch sich kreuzende Bahnkurven (b) Kollision durch Hüllkurvenüberlappung Neben punktuellen Kollisionen, die sich auf einen begrenzten Ort beschrän- ken, sind kinematisch bedingte Frontalkollisionen (siehe Abbildung 2.9a) und kinodynamisch bedingte Heckkollisionen (siehe Abbildung 2.9b) zu 2.4 Planung und Verwaltung von Objektbewegungen 27 unterscheiden. Bei Frontalkollisionen kommt es ohne Richtungsänderung zwingend zu einer Kollision, solange sich mindestens ein Objekt weiterbe- wegt. Zu einer Heckkollision kommt es nur dann, wenn Geschwindigkeits- oder Beschleunigungswerte nicht nicht rechtzeitig angeglichen werden. (a) (b) Abb. 2.9 (a) Frontalkollision und (b) Heckkollision Die in Abbildung 2.8 und Abbildung 2.9 dargestellten Situationen sind ar- chetypische Beispiele, die in beliebiger Reihenfolge kombiniert und verkettet werden können. Insbesondere in Situationen, wo sich mehr als zwei Objekte auf begrenztem Raum bewegen, kann das Vermeiden einer ersten Kollision zur nächsten Kollisionsmöglichkeit führen. Eine Kollision kann im Allgemeinen durch Geschwindigkeitsänderungen vermieden werden, also Beschleunigungs- oder Bremsmanöver, durch War- ten im Stillstand oder durch eine Richtungsänderung bzw. ein Ausweichma- növer. Eine Ausnahme bildet die Frontalkollision, die immer ein Ausweichen erfordert. Die Maßnahmen zur Vermeidung von Kollisionen können beliebig kombiniert und verkettet werden. Stau Stau entsteht immer dann, wenn Kollisionen durch Warten im Stillstand vermieden werden. Es kann zwischen prozessbedingten Staus und koordinati- onsbedingten Staus unterschieden werden. Die prozessbedingten Wartezeiten entstehen durch den Zwang mehrerer Objekte, einen spezifischen Ort zu besuchen. Wenn innerhalb eines Zeitraums die Anzahl der Ankünfte größer ist als die Anzahl der Abfertigungen, dann entstehen Wartezeiten und damit Stau. Im Gegensatz dazu entstehen koordinationsbedingte Staus aus Wartezu- ständen, die rein durch die Bewegungskoordination verursacht werden. Ein Beispiel hierfür ist in Abbildung 2.10 dargestellt. Es entsteht Stau an einer Zusammenführung der Bahnkurven, obwohl mit den gestrichelten Linien mögliche freie Bewegungsmöglichkeiten aufgezeigt sind. Durch Stau entstehen physische Warteschlangen im logistischen Raum, die als kinematische Hindernisse auf nicht am Stau direkt beteiligte Objekte 28 2 Grundlagen Abb. 2.10 Staubildung durch Warten im Stillstand wirken. Staueffekte können sich so im Raum ausbreiten, indem immer mehr Objekte warten müssen. Livelocks und Deadlocks Eine besondere Form des Konflikts kann entstehen, wenn die Engstelle oder Ressource, auf die gewartet wird, aufgrund spezifischer Regeln der Bewe- gungskoordination niemals freigegeben wird. Zu diesen Fällen gehören sogenannte Livelocks, bei denen ein Objekt unendlich lange wartet, da der zu erreichende Ort durch eine unendliche Kette von höher priorisierten Objekten blockiert wird (siehe Abbildung 2.11). Abb. 2.11 Entstehung eines Livelocks durch unendlich langes Warten auf eine unendlich große Zahl von höher priorisierten Objekten Eine weitere Art eines solchen Konflikttyps bilden Deadlocks, bei denen durch spezifische Regeln der Bewegungskoordination eine zirkuläre War- tebeziehung entstanden ist. Ein lokaler Deadlock ist in Abbildung 2.12 ab- gebildet. Er ähnelt der Situation im Straßenverkehr, wo an einer einfachen Kreuzung von allen vier Seiten gleichzeitig Verkehrsteilnehmer ankommen. Hier greift die Rechts-vor-Links-Regelung nicht mehr, da sie zu einer zir- kulären Wartebeziehung führt. Es bedarf einer gesonderten Auflösung des lokalen Deadlocks (üblicherweise durch gezielte zusätzliche Kommunikation unter den Teilnehmern). Während lokale Deadlocks relativ intuitiv zu erkennen sind, ist die Situation bei nichtlokalen Deadlocks beliebig komplex. Hier entstehen die zirkulären Wartebeziehungen zum Beispiel wie in Abbildung 2.13 dargestellt durch ungünstig liegende Warteschlangen. 2.4 Planung und Verwaltung von Objektbewegungen 29 Abb. 2.12 Entstehung eines lokalen Deadlocks Abb. 2.13 Entstehung eines nichtlokalen Deadlocks Livelocks und Deadlocks entstehen durch unvollständig definierte Regeln der Bewegungskoordination, insbesondere sind reaktive bzw. lokal entschei- dende Verfahren anfällig, da hier notwendiges globales Wissen fehlt. Über den Begriff der Schwarmintelligenz Der Begriff der Schwarmintelligenz ist in den vergangenen Jahren auf vielfäl- tige Weise in der Wissenschaft verwendet worden (vgl. [Sun+20], [Yan+17], [NXZ20]). Grundsätzlich lässt sich mit dem Begriff die Übernahme biologi- scher Prinzipien anhand des Verhaltens von Tieren in die Gestaltung von Algorithmen beschreiben. Dabei werden bestimmte Schwarmverhaltenswei- sen aus der Natur, wie etwa Vogelschwärme, als Ausgangspunkt verwendet. Schwarmintelligenz kann als Simulation sozialer Verhaltensweisen interpre- tiert werden, wobei dem kooperativen Aspekt, im Gegensatz zu Methoden der simulierten Evolution, eine besondere Bedeutung zukommt. Am Ausgangspunkt der wissenschaftlichen Betrachtung von Schwarmin- telligenz stehen Arbeiten über die Simulation von Vogelschwärmen, die zu der Erkenntnis kommen, dass durch lokale Beobachtung von Flugnachbarn und durch die Anwendung einfacher Regeln zur Bestimmung der Flugrich- tung und -geschwindigkeit einzelner Vögel das komplexe Verhalten eines 30 2 Grundlagen gesamten Vogelschwarms nachgebildet werden kann (vgl. [Rey87]). Optimierung In abstrahierter Form wird die simulierte Bewegung von Or- ganismen als Basis für die Partikelschwarmoptimierung verwendet (engl. particle swarm optimization, PSO), die eine Methode für die Optimierung kontinuierlicher, nichtlinearer Funktionen darstellt (vgl. [KE95]). Als Optimie- rungsmethode existiert Schwarmintelligenz als eine von vielen Heuristiken, um klassische Problemstellungen zu lösen, sodass die biologischen und so- zialen Methaphern in den Hintergrund rücken. Hier ist die Position eines Partikels als Teil einer Lösungsinstanz im n-dimensionalen Suchraum de- finiert und die Geschwindigkeit als Veränderungsrate dieser Position pro Iterationsschritt des Optimierungsalgorithmus anzusehen (vgl. [Ban19]). Lokale Kollisionsvermeidung Aus Sicht der Robotik kann Schwarmintel- ligenz als Teil eines Steuerungsverfahrens für Multi-Robotersysteme ver- standen werden. Dabei ist die lokale Kollisionsvermeidung von einer globalen Bewegungsplanung zu unterscheiden, da der Weg zum Zielpunkt nicht voll- ständig geplant wird, sondern jeder einzelne Roboter eine individuelle Regel- einrichtung darstellt, für die in kurzen Zyklen der Geschwindigkeitsvektor angepasst wird. Über Sensoren nimmt jeder Roboter laufend die Nachbar- schaftsumgebung wahr und bestimmt den eigenen Geschwindigkeitsvektor unter Berücksichtigung der Anwesenheit und der Geschwindigkeitsvektoren anderer Roboter. Ein wichtiges Merkmal dieser Art der Schwarmsteuerung ist das Prinzip der Reziprozität, bei der alle Roboter dieselben Regeln ver- wenden und somit jeder einzelne Roboter das zukünftige Verhalten anderer Roboter vorhersagen kann. Auf diesem Prinzip basiert das Konzept der Reciprocal Velocity Obstacles (RVO) (vgl. [Guy+09]). Eine Weiterentwicklung des Konzepts der RVO sind die sogenannten ORCA Lines, für die gezeigt wurde, dass eine optimale Schwarmsteuerung ohne Kollisionen erreichbar ist (vgl. [van+11b]). Dabei wird von einem holonomischen Bewegungsmo- dell ausgegangen und es werden keine differenziellen Zwangsbedingungen berücksichtigt. Die Garantie der Kollisionsfreiheit kann daher in bestimmten Situationen zu sehr hohen Geschwindigkeits- und Beschleunigungswerten führen. Im Rahmen dieser Arbeit wird der Begriff der Schwarmintelligenz vor allem in Bezug auf die logistische Bewegungsplanung, daher eher in der zur Robotik neigenden Interpretation, betrachtet. Die soziale Methapher kann jedoch gerade bei der Mensch-Maschine-Interaktion wieder in den Vordergrund treten (vgl. Social Networked Industry). Bei der Betrachtung der Leistung des logistischen Systems ist die Sichtweise von Seiten der Opti- mierung von Interesse, da hier insbesondere die Abwägung zwischen der effizienten Zielerreichung des Individuums und der Gesamtsystemleistung besonderer Aufmerksamkeit bedarf. 2.4 Planung und Verwaltung von Objektbewegungen 31 2.4.1 Grundlagen der Bewegungsplanung Der Großteil der Grundlagen der Bewegungsplanung wird in dieser Arbeit auf Basis des Standardwerks „Planning Algorithms“ von Steve M. LaValle eingeführt (vgl. [LaV06]). Dabei wird das Hauptaugenmerk auf die theoreti- schen Grundlagen gelegt, die unabhängig von der technischen Ausführung eines Roboters gelten. Das Ziel dieser Grundlagenbetrachtung ist eine Über- tragung auf allgemeine logistische Systeme, so dass einige Begriffe geändert werden, um den veränderten Fokus zu unterstreichen: • Der Begriff des Roboterswird durch das allgemeinere bewegte Objekt er- setzt. Dies soll eine Erweiterung der Perspektive auf die Übertragung in die Logistik unterstützen, da der Begriff des Roboters im Allgemein- gebrauch auf konkrete Ausführungen von Robotern in der Logistik be- schränkt ist (z. B. Greifarm-Roboter, Fahrerlose Transportsysteme usw.) • Mit der gleichen Motivation wird der FachbegriffMotion Planning durch die deutsche Übersetzung Bewegungsplanung ersetzt, sodass die Verall- gemeinerung der Robotik-Grundlagen auf physische Objekte sprachlich unterstützt wird. • In den formalen Beschreibungen wird die Variable X für den Zustands- raum durch die Variable Z ersetzt. Zum einen liegt dies näher am deut- schen Begriff des Zustandsraums, zum anderen kann so ein Konflikt mit der Bezeichnung der Koordinate x vermieden werden, die häufig verwendet wird. Zustandsraum Planungsprobleme umfassen einen Zustandsraum, der alle möglichen Situationen erfasst, die auftreten können. Der Zustandsraum kann z. B. die Position und Orientierung eines Roboters darstellen. Es können so- wohl diskrete (endliche oder abzählbar unendliche) als auch kontinuierliche (nicht abzählbar unendliche) Zustandsräume auftreten. Der Zustandsraum wird in der Regel implizit durch einen Planungsalgorithmus dargestellt. In den meisten Anwendungen ist die Größe des Zustandsraums (in Bezug auf die Anzahl der Zustände oder die kombinatorische Komplexität) viel zu groß, um explizit dargestellt zu werden. ZeitAlle Planungsprobleme sind ihrer Natur nach dynamisch. Sie beinhalten eine Abfolge von Entscheidungen, die im Laufe der Zeit getroffen werden müssen. Die Zeit kann explizit modelliert werden, wie im Fall eines Transpor- troboters, dessen Geschwindigkeit und Richtung während seiner Bewegung geplant wird. Die Zeit kann aber auch implizit sein, indem sie einfach die Tatsache widerspiegelt, dass die Aktionen nacheinander erfolgen müssen (lo- gische Zeit). Der genaue Zeitpunkt einer Aktion ist unwichtig, aber die richti- ge Reihenfolge muss eingehalten werden. Wie im Falle von Zustandsräumen 32 2 Grundlagen kann die Zeit entweder diskret oder kontinuierlich dargestellt werden. Aktionen Ein Plan legt Aktionen fest, die den Zustand verändern. Es muss angegeben werden, wie sich der Zustand ändert, wenn die Aktionen aus- geführt werden. Dies kann als zustandsbewertete Funktion für den Fall diskreter Zeit oder als gewöhnliche Differenzialgleichung für kontinuierliche Zeit ausgedrückt werden. Eine explizite Bezugnahme auf die Zeit wird ver- mieden, wenn direkt ein Pfad durch einen kontinuierlichen Zustandsraum generiert wird. Ausgangs- und Zielzustand Die Lösung eines Planungsproblems beginnt in der Regel in einem bestimmten Ausgangszustand und endet in einem bestimmten Zielzustand (oder einem beliebigen Zustand aus einer Menge von Zielzuständen). Die Aktionen eines Plans werden ausgewählt, um dieses Ziel zu erreichen. Planungskriterium Das Kriterium definiert das gewünschte Ergebnis eines Plans in Bezug auf den Zielzustand und die durchgeführten Aktionen. Übli- cherweise werden zwei Kriterien unterschieden: • Durchführbarkeit Ein Plan ist durchführbar, wenn er unabhängig von seiner Effizienz zum Erreichen eines Zielzustands führt. • Optimalität Ein Plan ist optimal, wenn er durchführbar ist und zusätzlich eine spezifizierte Leistung optimiert (z. B. kürzester Weg, schnellster Transport) und darüber hinaus einen Zielzustand herbeiführt. Bei vielen Bewegungsplanungsproblemen kann das Erreichen der Durch- führbarkeit eine große Herausforderung sein. Das Erreichen der Optimalität ist bei den meisten Problemen sehr viel schwieriger. LaValle zufolge konzen- triert sich der Großteil der Literatur in der Robotik, der Steuerungstheorie und verwandten Bereichen auf die Optimalität, die jedoch für viele Probleme nicht unbedingt wichtig ist. In der Tat ist es bei vielen Anwendungen, wie z. B. in der Logistik, schwierig, das richtige Kriterium für die Optimierung zu bestimmen. Selbst wenn ein wünschenswertes Kriterium formuliert werden kann, ist es möglicherweise unmöglich, einen praktischen Algorithmus zu entwickeln, der optimale Pläne berechnet. In solchen Fällen sind praktische Lösungen auf jeden Fall besser, als gar keine Lösungen zu haben (vgl. [LaV06] S. 18). Plan Im Allgemeinen ist ein Plan ein Algorithmus, der einem Entscheidungs- träger eine bestimmte Strategie oder ein bestimmtes Verhalten vorschreibt. Im einfachsten Fall kann ein Plan eine Abfolge von Handlungen vorschrei- ben, die zum Erreichen des Zielzustands führen. 2.4 Planung und Verwaltung von Objektbewegungen 33 Bewegungsplaner Ein Bewegungsplaner konstruiert einen Plan und kann im Allgemeinen eine Maschine oder ein Mensch sein. Wenn der Bewegungs- planer Teil einer Maschine ist, wird er als Planungsalgorithmus betrachtet. In Fällen, in denen der Mensch die Bewegungsplanung vornimmt, übernimmt er die Rolle des Algorithmus. 2.4.2 Bewegungsplanung in diskreten Weltmodellen Die gitterbasierte diskrete Bewegungsplanung basiert auf einem einfach zu beschreibenden Weltmodell, dessen Zustandsraum in vielen Fällen endlich ist. Daher sind keine geometrischen Modelle oder Differenzialgleichungen erforderlich, um diskrete Planungsprobleme zu charakterisieren. Die Grund- idee ist, dass jede unterschiedliche Situation der Welt als ein Zustand z angenommen wird und die Menge aller möglichen Zustände den Zustands- raum Z bildet. Für die diskrete Planung ist es wichtig, dass diese Menge abzählbar ist (vgl. [LaV06] S. 28ff). Das Weltmodell kann durch die Anwendung von Aktionen, die vom Bewegungsplaner ausgewählt werden, transformiert werden. Jede Aktion u, wenn sie vom aktuellen Zustand z aus angewendet wird, erzeugt einen neuen Zustand z′, der durch eine Zustandsübergangsfunktion f spezifiziert wird. Mit f lässt sich die folgende Zustandsübergangsgleichung aufstellen: z′ = f (z,u) Mit U(z) wird der Aktionsraum für jeden Zustand z bezeichnet, der die Menge aller Aktionen darstellt, die von x aus angewendet werden können. Für verschiedene z,z′ ∈ Z sind U(z) und U(z′) nicht notwendigerweise disjunkt, da die gleiche Aktion in mehreren Zuständen anwendbar sein kann. Die Definition eines Bewegungsplanungsproblems beginnt üblicherweise mit einem Initialzustand zI ∈ Z und beinhaltet eine Menge von Zielzuständen ZG ⊂ Z , die zur Lösung des Problems erreicht werden müssen. Die Aufgabe des Bewegungsplaners ist die Suche nach einer geeigneten Sequenz von Aktionen, die einen der Zielzustände erreicht. Ein typisches Weltmodell für die diskrete Bewegungsplanung geht von einem gitterbasierten Layout aus, bei dem jeder Gitterpunkt ganzzahlige Koordinaten der Form (x,y) hat. Innerhalb dieses Modells kann ein Bewe- gungsobjekt diskrete Schritte in eine von vier Richtungen (Norden, Süden, Osten, Westen) machen, wobei jeder Schritt eine Koordinate erhöht oder verringert. Die Bewegungen und der zugehörige Zustandsübergangsgraph sind in Abbildung 2.1 dargestellt. Man kann sie sich als einzelne Schritte auf einem unendlichen Fliesenboden vorstellen. Die Zustandsmenge Z in diesem Weltmodell sei die Menge aller ganz- zahligen Paare der Form (x,y), wobei x,y ∈ Z ist. Die Aktionsmenge U = {(0,1), (0,−1), (1,0), (−1,0)} definiert alle Aktionen, die ausgeführt 34 2 Grundlagen Abb. 2.14 Zustandsübergangsgraph für ein unendliches gitterbasiertes Weltmodell nach [LaV06] werden können. Im allgemeinen Fall eines unendlichen Gitters gilt für alle z ∈ ZundU(z) =U. Die Zustandsübergangsgleichung lautet f (z,u) = z+ u, wobei z ∈ Z und u ∈ U als zweidimensionale Vektoren zur Addition be- handelt werden. Wenn zum Beispiel z = (9,2) und u = (0,−1), dann ist f (z,u) = (9,1). Grenzen und Hindernisse können zumWeltmodell hinzugefügt werden, indem Gitterpunkte gesperrt werden. Für die nicht blockierten benachbarten Gitterpunktewird die AktionsmengeU(z) so reduziert, dass keine Bewegung in das Hindernis hinein möglich ist. Eine äußere Begrenzung kann durch Einschließen einer begrenzten Region entworfen werden, was dazu führt, dass X endlich wird. Abb. 2.15 Gitterbasiertes Weltmodell mit Hindernissen und Außengrenze nach [LaV06] 2.4 Planung und Verwaltung von Objektbewegungen 35 Suche in gitterbasierten Weltmodellen Zur Lösung des Bewegungsplanungsproblems durschucht der Bewegungs- planer den Zustandsübergangsgraphen nach einer durchführbaren Sequenz von Aktionen, die vom Initialzustand in einen Zielzustand führt. Dazu wer- den graphenbasierte Suchalgorithmen verwendet, die die Knoten des Gra- phen entlang seiner Kanten durchsuchen. Wichtig bei der Auswahl eines Suchalgorithmus ist, dass er systematisch vorgeht und jeden Knoten des Zustandsübergangsgraphen betrachtet. Neben der klassischen Tiefen- und Breitensuche sind insbesondere der Algorithmus von Dijkstra sowie der A∗-Algorithmus zu nennen. Die letzt- genannten haben den Vorteil, dass sie nicht nur einen durchführbaren Plan finden, sondern auch einen optimalen Plan bestimmen können. Multi-Agent Pathfinding in gitterbasierten Weltmodellen Die Koordination der Bewegung einer Vielzahl von Robotern oder Agen- ten ist ein jahrzehntealtes Problem der Robotikforschung (siehe Unterab- schnitt 2.4.5). Auf Basis eines spezifischen Anwendungsfalls aus der Logistik – es hancdelt sich um das Kommissioniersystem von Amazon Robotics (ehe- mals Kiva) – ist in den letzten Jahren das Forschungsfeld zu diesem Thema für diskrete Weltmodelle deutlich weiterentwickelt worden (vgl. [WDM08]). In [SS20] wird ein guter Überblick zur aktuellen Forschung gegeben. Formal wird das Basisproblem alsMulti Agent Path Finding (MAPF) bezeichnet. Es handelt sich hier um die Aufgabe, einen kollisionsfreien Pfad vom Start zum Ziel für jedes bewegte Objekt zu finden. Formal kann die Problemstellung folgendermaßen beschrieben werden: • ein WeltmodellW = R2 • ein diskretisiertes Zeitintervall T = [0, t f ] ∈N, wobei der Zeitpunkt t f als die Zielerreichung des letzten Objekts definiert ist • die bewegten Objekte, repräsentiert durch k Agenten A1, . . . ,Ak • für jeden Agenten i ein Konfigurationsraum Ci als Diskretisierung vonW mit qi = (x,y) für alle qi ∈ Ci und x,y ∈Z • eine grundlegende Menge von Aktionen B = {(0,0), (0,1), (0,−1), (1,0), (−1,0)}, wobei b = (0,0) das Verbleiben in der selben Konfiguration bedeutet • eine statische Hindernisregion O ⊂ C, die sich niemals ändert • ein Zustandsraum Z , der als kartesisches Produkt Z = C1 × C2 × · · · × Ck × T definiert ist • eine Aktionsmenge U, die als kartesisches Produkt U = B1 × · · · × Bk × {1} definiert ist • eine Zustandsübergangsgleichung f (z,u) = z+ umit z ∈ Z und u ∈U 36 2 Grundlagen • eine Hindernisregion in(Z , die)als  ×k ⋃  ⋃Z O × T Z ijobs =   obs i=1 ij, i 6=j definiert wird und bei der Z ijobs eine dynamische Hindernisregion für ein Agentenpaar A1 und Aj darstellt • der freie Zustandsraum Z f ree = Z\Zobs • ein Initialzustand zinit ∈ Z f ree,(der die Initialko)nfigurationen z = q1init init, . . . ,q k init, 0 aller bewegten Objekte beinhaltet • ein Zielzustand zziel ∈ Z f ree, d(er die Zielkonfigu)rationen zziel = q1 kziel , . . . ,qziel , tF aller bewegten Objekte beinhaltet Die hier gewählte Form der Problembeschreibung orientiert sich an dem Vor- gehen bei LaValle und vermeidet eine spezifische Graphstruktur G = (V,E) zugunsten eines diskretisierten Raums mit einer darauf definierten diskreten Aktionsmenge. Beides ist äquivalent, aber die hier gewählte Form vereinfacht den Übergang und Vergleich zu einem kontinuierlichen Zustandsraum. Der Zeitfortschritt ist diskret, und in jedem Schritt wählt jeder Agent Ai eine mögliche Aktion b ∈ B aus, wobei er sich entweder in eine benachbarte Gitterzelle bewegt oder in seiner bisherigen Zelle verbleibt. Eine Aktion gilt als konfliktfrei, wenn keine zwei Agenten zur gleichen Zeit in derselben Gitterzelle positioniert sind und auch kein direkter Platztausch stattfindet, bei dem sich die Agenten im selben Zeitschritt durcheinander bewegen. Formal ist das über die Definition der dynamischen Hindernisregion Z ijobs beschrieben, die für jedes unterschiedliche Agentenpaar Ai,Aj mit i 6= j alle Zustände z ∈ Z beinhaltet, bei denen qi = qj. Ein vollständiger Algorithmus berechnet für alle Agenten einen konflikt- freien Pfad von der Initialposition bis zum Ziel. Ein optimaler Algorithmus minimiert zusätzlich entweder die Zykluszeit (engl. makespan) oder die Summe der Durchlaufzeiten (engl. flowtime) des Gesamtsystems. 2.4.3 Bewegungsplanung in kontinuierlichen Weltmodellen Die Bewegungsplanung in kontinuierlichen Weltmodellen vermeidet die direkte Diskretisierung des Zustandsraums und nimmt in Kauf, dass dieser nicht mehr explizit abgebildet werden kann, da er unabzählbar unendlich 2.4 Planung und Verwaltung von Objektbewegungen 37 wird. Sie erfordert eine zusätzliche, manchmal komplexe Transformation zwischen dem kontinuierlichenWeltmodell, in dem ein Plan ausgeführt wird, und dem Raum, in dem die Planung stattfindet. Diese Trennung von Weltmodell und Planungsraum führt zum Konzept des Konfigurationsraums, dessen Dimensionalität von den Freiheitsgraden des zu bewegenden Objekts abhängt. Über das Konzept des Konfigurati- onsraums kann die Bewegungsplanung als eine Art von Suche in einem hochdimensionalen Zustandsraum angesehen werden. Eine Komplikation besteht darin, dass Konfigurationsräume eine ungewöhnliche topologische Struktur haben, die korrekt charakterisiert werden muss, damit Planungsal- gorithmen korrekt funktionieren. Ein Bewegungsplan kann anschließend als ein kontinuierlicher Pfad im Konfigurationsraum definiert werden. Auch wenn das Weltmodell kontinuierlich bleibt, transformieren die Pla- nungsalgorithmen das kontinuierliche Modell irgendwann und irgendwie in ein diskretes Modell. Dieser transformierende Prozess der Diskretisie- rung ist charakteristisch für die Entwicklung verschiedener Algorithmen für spezifische Problemstellungen. LaValle stellt in seinem Grundlagenwerk systematisch verschiedene Ansätze vor. Er stellt fest, dass sich mit kombi- natorisch vollständigen Methoden theoretisch praktisch jedes Bewegungs- planungsproblem lösen lässt. In einigen wenigen Fällen lassen sich in der Praxis sehr elegante Lösungen erstellen. Für die Mehrzahl der industrie- bezogenen Bewegungsplanungsprobleme sind diese Algorithmen jedoch aufgrund ihrer Laufzeiten und Implementierungsschwierigkeiten uninter- essant. Im Gegensatz dazu haben stichprobenbasierte Algorithmen einen großen Teil der praktischen Probleme gelöst, auch wenn die Vollständigkeits- garantien schwächer sind. Ein großer Vorteil ist ihre Effizienz und einfache Implementierung für eine Vielzahl von Anwendungen (vgl. [LaV06] S. 80ff). Geometrische Repräsentation und Transformation von Hindernissen und beweglichen Objekten In einem kontinuierlichenWeltmodell bedarf es einer explizit definierten geo- metrischen Repräsentation von bewegten Objekten und Hindernissen. Dazu existieren grundsätzlich zwei alternative Ansätze. Entweder werden nur die geometrischen Grenzen betrachtet oder es werden solide Objekte verwendet, deren Punktmengen bestimmt werden. Zunächst wird das Weltmodell als die MengeW definiert, deren Dimension in den meisten praktischen Anwen- dungen aufW = R2 (2D-Welt) oderW = R3 (3D-Welt ) beschränkt ist. Des Weiteren enthält diese Welt zwei Arten von Entitäten: • Hindernisse Teile der Welt gelten als dauerhaft belegt (z. B. Wände in einem Gebäude). Die HindernisregionO ⊆W beschreibt die Menge aller Punkte, die innerhalb von unbeweglichen Hindernissen liegen. 38 2 Grundlagen • Bewegliche Objekte Es existiert eine Anzahl von beweglichen Objekten 0, . . . ,n, deren physische Körper jeweils über eine Menge an belegten Punkten A0, . . . ,An abgebildet sind. Es gilt A 2 3x ∈ R oder Ax ∈ R für die Menge der Punkte, die ein bewegliches Objekt x belegt, wobei die Dimension von Ax mit der WeltW übereinstimmt. Während die unbeweglichen Hindernisse ausO durch Polygone oder andere geometrische Modelle abgebildet werden, die effizient in einem Rechner verarbeitet werden können (vgl. [LaV06] S. 82ff), bedarf es bei einem beweg- lichen Objekt A zusätzlich zur Abbildung des Körpers eine Beschreibung seiner Position und Orientierung inW . Diese Transformation wird als Funk- tion h : A 7→ W angegeben. Dabei wird der Körper als starr im Sinne der TechnischenMechanik angesehen, sodass nach einer Transformation für jedes Punktpaar in A die euklidische Distanz erhalten bleiben muss. Zusätzlich ist gefordert, dass die Orientierung des Objekts erhalten bleibt, da Spiegel- bilder nicht erlaubt sind. Grundsätzlich können unterschiedliche Arten von Transformationen über einen zusätzlichen Parametervektor q ∈Rn definiert werden, sodass h(q, a) für jeden transformierten Punkt a ∈ A und für das ganze Objekt h(q,A) ⊂W gilt. LaValle führt als vereinfachte Schreibweise die Notation A(q) ein. Dabei wird erst durch die Transformation A in W platziert, die Funktion ist technisch gesehen eine orientierungserhaltende isometrische Einbettung (vgl. [LaV06] S. 94). Jeder Punkt a ∈ A wird in ei- nem objektbezogenen Koordinatensystem notiert, während für jeden Punkt w ∈W das Koordinatensystem des Weltmodells verwendet wird. Für den für diese Arbeit relevanten Fall W = R2 (2D-Welt) beschreibt LaValle die beiden Transformationen der Translation und der Rotation. Ein bewegliches Objekt A ∈ R2 wird unter Zuhilfenahme des Parameters q = (xt,yt)mit xt,yt ∈R translatorisch bewegt. Die Funktion h ist in diesem Fall wie folgt definiert: h(x,y) = (x+ xt,y+ yt). Für die Rotation von A gegen den Uhrzeigersinn nach einem Winkel θ ∈ [0,2π) wird jeder Punkt (x,y) ∈ A nach folgender Gleichung abgebildet: (x,y) 7→ (x cos θ − y sin θ,x sin θ + y cos θ). Eine Kombination aus Rotation mit anschließender Translation wird über eine sogenannte homogene Transformationsmatrix abgebildet, die mit cosθ −sinθ xt T = sinθ cosθ yt 0 0 1 2.4 Planung und Verwaltung von Objektbewegungen 39 ausgedrückt werden kann. In vereinfachter Notation lässt sich die Transfor- mation mit A(xt,yt,θ) schreiben. Die drei Parameter weisen dabei auch auf die drei Freiheitsgrade des beweglichen Objekts in einer 2D-Welt hin. Für den hier nicht betrachteten Fall einer 3D-Welt kann das Transformati- onskonzept im Prinzip übernommen werden, wobei die Rotation deutlich komplexer wird (vgl. [LaV06] S. 97ff). Konfigurationsraum In Abschnitt 2.4.3 wurde nur die grundsätzliche Modellierung und Transfor- mation von Hindernissen und beweglichen Objekten betrachtet. Für die wei- tere Bewegungsplanung ist eine Definition des Zustandsraums notwendig, über den die Menge der möglichen Transformationen für das zu bewegende Objekt abgebildet wird (vgl. [LaV06] S. 127ff). Das Konzept des Konfigurati- onsraums gehört zu den Grundlagen der Bewegungsplanung in der Robotik und basiert in weiten Teilen auf einer Anwendung von Konzepten der Topo- logie aus der Mathematik. Der Konfigurationsraum stellt eine Abstraktion des zugrunde liegenden Weltmodells dar und ermöglicht eine allgemeine Beschreibung und Lösung von Problemen der Bewegungsplanung. Grundlegende topologische Konzepte Die grundlegenden topologischen Konzepte werden im Standardwerk von LaValle beschrieben und werden hier nicht vollständig mit allen Beispie- len wiedergegeben (vgl. [LaV06] S.127ff). Die wichtigsten Konzepte für die Bewegungsplanung in dieser Arbeit sollen hier genannt werden, damit die folgenden Ausführungen zumKonfigurationsraum darauf aufbauen können. Topologischer Raum Das Konzept des topologischen Raums ermöglicht ei- nen Umgang mit unabzählbaren unendlichen Weltmodellen. Es kann als Generalisierung der Konzepte offener und geschlossener Intervalle in R auf- gefasst werden. Die in beiden Fällen vorhandenen Grenzpunkte ermöglichen die Bestimmung einer unendlichen Untermenge, ohne die gesamte Menge zu diskretisieren. Eine Menge X wird dann topologischer Raum genannt, wenn es eine Anzahl von Untermengen von X gibt, die offene Mengen genannt werden und für die folgende Axiome gelten: • Die Vereinigung einer beliebigen Anzahl von offenen Mengen ist eine offene Menge. • Die Schnittmenge einer endlichen Anzahl von offenen Mengen ist eine offene Menge. • Sowohl X als auch ∅ sind offene Mengen. 40 2 Grundlagen Für den Fall X = R sind erwartungsgemäß offene Intervalle wie (0,1) ein Beispiel für offene Untermengen. Geschlossene Mengen Eine Untermenge C ⊂ X eines topologischen Raums X ist genau dann eine geschlossene Menge, wenn das Komplement X\C eine offene Menge ist. Ein Beispiel hierfür ist das geschlossene Intervall [0,1] ∈R, dessen Komplement (−∞,0) ∪ (1,∞) eine offene Menge ist. Besondere Punkte Für die Bewegungsplanung sind einige weitere Begriffe, die auf topologischen Räumen definiert werden können, von besonderem Interesse. Sei X ein topologischer Raum und seiU eine beliebige Untermenge von X. Des Weiteren sei x ein beliebiger Punkt in X. Die folgenden Begriffe beschreiben die jeweilige Beziehung eines Punktes x zur Untermenge U: • Innerer PunktWenn es eine offeneMengeO1 mit x∈O1 undO1⊆U gibt, dann wird x als innerer Punkt von U bezeichnet. Die Menge aller inneren Punkte von U wird Inneres von U genannt und mit int(U) bezeichnet. • Außenliegender PunktWenn es eine offene Menge O2 mit x ∈O2 und O2 ⊆ X\U gibt, dann wird x als äußerer Punkt in Bezug auf U genannt. • RandpunktWenn x weder ein innerer noch ein außenliegender Punkt ist, dann wird er Randpunkt genannt. Die Menge aller Randpunkte wird Rand von U genannt und mit ∂U bezeichnet. • Grenzpunkt Wenn x ∈ int(U) ∨ x ∈ ∂U, dann wird er zusätzlich als Grenzpunkt bezeichnet. Die Menge aller Grenzpunkt von U ist eine ge- schlosseneMenge, die Abschluss vonU genannt undmit cl(U) bezeichnet wird. Der Abschluss kann durch cl(U) = int(U) ∪ ∂U gebildet werden. Für den Fall X = R sind Randpunkte die Endpunkte von Intervallen. Zum Beispiel sind 0 und 1 die Randpunkte der Intervalle (0,1), [0,1], [0,0) und (0,1]. Hausdorff-Axiom Sei X ein topologischer Raum. Wenn es für jedes eindeuti- ge x1,x2 ∈ X jeweils eine offene Menge O1 und O2 gibt, sodass gilt x1 ∈O1, x2 ∈ O2 und O1 ∩O2 = ∅, dann erfüllt X das Hausdorff- Axiom und wird auch Hausdorff-Raum genannt. Das Hausdorff-Axiom ist von grundlegender Bedeutung, da es eine der möglichen Trennungseigenschaften in topologischen Räumen beschreibt. Kontinuität Die Definition der Kontinuität lässt sich über eine Funktion f : X 7→ Y, die eine Abbildung zwischen den topologischen Räumen X und Y beschreibt, einführen. Sei für jede Untermenge B ⊆ Y das Vorbild durch f−1(B) = {x ∈ X | f (x) ∈ B} 2.4 Planung und Verwaltung von Objektbewegungen 41 definiert. Dann ist f kontinuierlich, wenn f−1(O) eine offene Menge für jede offene Menge O ⊆ Y ist. Homöomorphismus Sei f : X 7→ Y eine bijektive Funktion zwischen den topologischen Räumen X und Y, dann existiert die inverse Funktion f−1. Wenn sowohl f als auch f−1 kontinuierlich sind, dann wird f ein Homöomor- phismus genannt. Wenn es mindestens einen Homöomorphismus zwischen zwei topologischen Räumen gibt, dann werden sie homöomorph genannt und können als X ∼= Y geschrieben werden. Implizit ist hierdurch eine Äquiva- lenzbeziehung auf der Menge topologischer Räume gegeben. Ein sehr bekanntes Beispiel für zwei homöomorphe topologische Räume sind eine Kaffeetasse mit einem Henkel und ein Donut. Jedes offene Intervall in R ist homöomorph zu jedem anderen offenen In- tervall. Zum Beispiel kann (0,1) über die kontinuierliche Abbildung x 7→ 5x auf (0,5) abgebildet werden, wobei (0,1) und (0,5) als topologische Unter- räume von R angesehen werden. Mannigfaltigkeiten In der Bewegungsplanung wird das Konzept der Mannigfaltigkeit eingesetzt, damit ein Konfigurationsraum die Eigenschaften der zugrunde liegenden Struktur des Transformationsraums widerspiegelt. Das Konzept der Man- nigfaltigkeit kann aus Sicht der Bewegung von physischen Objekten mit der intuitiven Vorstellung von einer Oberfläche verglichen werden, über die sich Objekte bewegen können. Ein topologischer Raum M ⊆Rm ist eine topologische Mannigfaltigkeit, wenn für jedes x ∈ M eine offene Menge O ⊂ M existiert, sodass x ∈ O, O homöomorph zu Rn und n für alle x ∈ M festgelegt ist. Die Anforderung der Homöomorphie zu Rn bedeutet intuitiv, dass an jedem Punkt x ∈ M die gleiche Menge an möglichen Bewegungsrichtungen existiert wie für einen Punkt y ∈ Rn. Kartesische Produkte Seien X und Y topologische Räume. Das kartesische Produkt X × Y definiert einen neuen topologischen Raum. Für jedes x ∈ X und y ∈ Y wird ein Punkt (x,y) ∈ X×Y generiert. Für jedes mögliche Paar von offenen Mengen in X und Y wird eine offenen Menge in X×Y erzeugt. Aus diesen Mengen können durch Vereinigung oder Schnitt alle weiteren offenen Mengen von X×Y erzeugt werden. Ein gutes Beispiel für ein kartesisches Produkt in der Bewegungsplanung (und in dieser Arbeit) ist R×R, das auch als R2 geschrieben wird. Im All- gemeinen ist Rn äquivalent zu Rn−1 ×R. Viele für die Bewegungsplanung wichtige Mannigfaltigkeiten werden durch kartesische Produkte konstruiert. 42 2 Grundlagen 1D-Mannigfaltigkeiten Die Menge R ist das anschaulichste einfache Bei- spiel für eine eindimensionale Mannigfaltigkeit. Interessant ist in diesem Zusammenhang auch die Mannigfaltigkeit, die durch das offene Einheitsin- tervall (0,1) beschrieben wird. Dieses ist homöomorph zu R, da jede offene Menge von R durch eine einfache Abbildungsfunktion gebildet werden kann. Eine weitere eindimensionale Mannigfaltigkeit, die nicht homöomorph zu (0,1) ist, beschreibt einen topologischen Kreis. Sei Rm = R2, dann sei S1 = {(x,y) ∈R2 | x2 + y2 = 1}. Aus topologischer Sicht können alle Mannigfaltigkeiten als topologischer Kreis angesehen werden, die homöomorph zu S1 sind (vgl. [LaV06] S. 135). Identifizierung Eineweitere Art, S1 zu definieren, kann über eine sogenannte Identifizierung erfolgen. Sei X ein topologischer Raum, dann sei mit X/ ∼ ein topologischer Raum bezeichnet, der in irgendeiner Weise durch eine Identifizierung neu definiert wurde. Somit kann S1 als [0,1]/ ∼ neu definiert werden und können durch 0∼ 1 die beiden Werte 0 und 1 als äquivalent deklariert werden. Dies hat intuitiv den Effekt, dass die beiden Enden des geschlossenen Einheitsintervalls [0,1] aneinandergeklebt werden. Auf diese Weise kann gezeigt werden, dass S1 durch eine geeignete Abbildung auch homöomorph zu [0,2π] oder [0,360] ist. Mit der Mannigfaltigkeit S1 lässt sich eine Rotation in allgemeiner Weise beschreiben (siehe auch [Que01] S. 44ff). 2D-Mannigfaltigkeiten Viele für die Bewegungsplanung wichtige zweidi- mensionale Mannigfaltigkeiten werden über die Anwendung des kartesi- schen Produkts auf 1D-Mannigfaltigkeiten erzeugt. Die 2D-Mannigfaltigkeit R2 wird über R×R gebildet. Ein unendlicher Zylinder lässt sich mit R× S1 definieren, während ein Torus (die Oberfläche eines Donuts oder einer Kaf- feetasse) über S1 × S1 definiert werden kann. Über eine Identifikation lassen sich 2D-Mannigfaltigkeiten erzeugen, die beispielsweise einMöbiusband re- präsentieren (vgl. [LaV06] S. 136). Pfade, Homotopie und räumlicher Zusammenhang Eine zentrale Fragestellung der Bewegungsplanung ist, ob ein Punkt im Raum von einem anderen Punkt aus erreichbar ist. Dies kann für diskrete Räume durch die Untersuchung des Zusammenhangs des Zustandsgra- phen untersucht werden, dessen Kanten die möglichen Zustandsübergänge abbilden. Im kontinuierlichen Raum stellt sich die Frage, ob es einen konti- nuierlichen Pfad zwischen zwei Punkten gibt (vgl. [LaV06] S. 139). 2.4 Planung und Verwaltung von Objektbewegungen 43 Pfad Sei X ein topologischer Raum und in diesem Fall auch eine Mannigfal- tigkeit. Ein Pfad ist eine kontinuierliche Funktion τ : [0,1]→ X. Jeder Punkt des Pfades ist durch τ(s)mit s ∈ [0,1] gegeben. Pfadzusammenhang Ein topologischer Raum X gilt als pfadzusammenhän- gend, wenn für alle x1,x2 ∈ X ein Pfad τ existiert, so dass τ(0) = x1 und τ(1) = x2. Homotopie Zwei Pfade τ1 und τ2, die gemeinsame feste Start- und End- punkte haben, gelten dann als homotop, wenn eine kontinuierliche Funktion h : [0,1]× [0,1]→ X existiert, für die folgende Bedingungen erfüllt sind: • h(s,0) = τ1(s) für alle s ∈ [0,1] • h(s,1) = τ2(s) für alle s ∈ [0,1] • h(0, t) = h(0,0) für alle t ∈ [0,1] • h(1, t) = h(1,0) für alle t ∈ [0,1] Der Parameter t steuert die graduelle Verformung des Pfades von τ1 bei t= 0 zu τ2 bei t = 1. Dieser Umstand wird durch die ersten beiden Bedingun- gen abgesichert. Die letzten beiden Bedingungen bedeuten, dass Start- und Endpunkt unverändert bleiben. Da h als kontinuierliche Funktion abgebildet wird, kann während der Verformung der abgebildete Pfad keine diskontinuierlichen Sprünge machen. Für den Fall der Mannigfaltigkeit R2 wird dadurch ein Überspringen von Löchern oder Hindernissen verhindert. Einfacher und mehrfacher Zusammenhang Sei X ein pfadzusammenhän- gender topologischer Raum. Dann definiert die Homotopie eine Äquivalenz- relation über die Menge aller Pfade, die zwei Punkte x1,x2 ∈ X miteinander verbinden. Wenn alle Pfade in dieselbe Äquivalenzklasse fallen, dann wird X als einfach zusammenhängend bezeichnet. Andernfalls wird X als mehrfach zusammenhängend bezeichnet. Definition des Konfigurationsraums Der Konfigurationsraum soll im Folgenden als Mannigfaltigkeit definiert wer- den, die aus den möglichen Transformationen ensteht, die ein bewegliches Objekt innerhalb eines Weltmodells ausführen kann. Um ein Bewegungs- planungsproblem zu lösen, wird der Konfigurationsraum durchsucht. Er abstrahiert komplizierte geometrischeModelle und Transformationen spezifi- scher Systemausprägungen und überführt diese auf das allgemeine Problem der Pfadsuche in einer Mannigfaltigkeit. Algorithmen, die eine Lösung für diese allgemeine Problemstellung bereitstellen, können auf eine Vielzahl von praktischen Problemstellungen angewandt werden. 44 2 Grundlagen Zweidimensionale starre Körper Da im Fall eines starren Körpers jedes xt,yt ∈R für eine Translation ausgewählt werden kann, ergibt sich hierfür die Mannigfaltigkeit M 21 = R . Unabhängig davon kann jede Rotation um denWinkel θ ∈ [0,2π) angewendet werden. Da 2π und 0 die gleiche Transfor- mation darstellen, können sie durch 2π ∼ 0 identifiziert werden. Die daraus entstehendeMannigfaltigkeit M2 ist homöomorph zu S1 und stellt die Menge aller 2D-Rotationen dar. Der Konfigurationsraum C = M1 ×M = R22 × S1 beschreibt alle mögli- chen Transformationen für starre Körper in einer zweidimensionalen Welt. Hindernisse im Konfigurationsraum Im vorherigen Abschnitt wurde der Konfigurationsraum C ohne Hindernisse betrachtet, sodass alle möglichen Konfigurationen gültig sind. Sobald Hin- dernisse berücksichtigt werden, müssen sämtliche Konfigurationen, die zu einer Kollision zwischen bewegtem Objekt und Hindernis führen, aus dem Konfigurationsraum entfernt werden. Sei mitW = R2 ein Weltmodell im zweidimensionalen Raum gegeben, das eine HindernisregionO ⊂W enthält. Des Weiteren wird ein bewegliches Objekt A ⊂W angenommen, das als starrer Körper definiert ist. Sei q ∈ C die Konfiguration von A, die mit q = (xt,yt,θ) definiert ist. Die Hindernisregion Cobs ⊆ C wird über Cobs = {q ∈ C | A(q) ∩O 6= ∅} definiert und beschreibt die Menge der Konfigurationen aus C, bei denen sich das transformierte ObjektA(q)mit den HindernissenO schneidet. DaO und A(q) geschlossene Mengen inW sind, ist Cobs eine geschlossene Menge in C. Der übrigbleibende Teil der Konfigurationen wird freier Raum genannt und ist als C f ree = C\Cobs definiert. Das Problem des KlaviertransporteursMit dem Problem des Klaviertrans- porteurs für zweidimesionale Welten wird die klassische Problemstellung der Bewegungsplanung im Allgemeinen beschrieben. Die Komponenten der Problemstellung lassen sich wie folgt auflisten: • ein WeltmodellW = R2 • eine Hindernisregion O ⊂W • ein bewegtes Objekt A, das inW definiert ist • der Konfigurationsraum C, der durch die Bestimmung aller möglichen Transformationen entsteht, die auf A angewendet werden können; die abgeleitete Hindernisregion Cobs und der freie Raum C f ree • eine Initialkonfiguration qi ∈ C f ree 2.4 Planung und Verwaltung von Objektbewegungen 45 • eine Zielkonfiguration qg ∈ C f ree Ein vollständiger Algorithmus muss einen kontinuierlichen Pfad τ : [0,1]→ C f ree berechnen, sodass τ(0) = qi und τ(1) = qg sind oder die korrekte Rück- meldung geben, dass ein solcher Pfad nicht existiert. Es wurde gezeigt, dass dieses Problem PSPACE-hart ist, was NP-hart impliziert (vgl. [LaV06] S. 158). Metrische Räume Eine grundlegende Operation für Algorithmen in der Bewegungsplanung ist die Messung der Distanz zwischen zwei Punkten im Raum. Es ist einfach, den euklidischen Abstand in Rn zu definieren. Um eine Abstandsfunktion über einem beliebigen C zu definieren, müssen jedoch bestimmte Axiome erfüllt sein, damit sie mit den intuitiven Erwartungen auf der Grundlage des euklidischen Abstands übereinstimmt. Die folgenden Definitionen und Axiome bilden die Basis für eine Funktion, die einen topologischen Raum zu einem metrischen Raum weiterentwickelt. Einmetrischer Raum (X,ρ) ist ein topologischer Raum X, über den eine Funkti- on ρ : X×X→R definiert ist, so dass für beliebige Punkte a,b, c ∈ X folgende Eigenschaften gelten: • ρ(a,b) ≥ 0 (Nicht-Negativität) • ρ(a,b) = 0 genau dann, wenn a = b (Reflexivität) • ρ(a,b) = ρ(b, a) (Symmetrie) • ρ(a,b) + ρ(b, c) ≥ ρ(a, c) (Dreiecksungleichheit) Die Funktion ρ definiert die Distanzen zwischen zwei Punkten immetrischen Raum, und die vier Bedingungen entsprechen der intuitiven Vorstellung über das Konzept der Distanz. Insbesondere die letzte Bedingung impliziert eine Optimalität von ρ in dem Sinn, dass die Distanz zwischen zwei Punkten stets weniger oder gleich groß ist als der Weg über einen Zwischenpunkt. Die wichtigste Familie von Metriken über Rn sind die sogenannten Lp- Metriken, die für ein beliebiges p(≥ 0 mit ) 1 n p ρ(x,x′) = ∑ | x − x′ |pi i i=1 bestimmt werden können. In dieser Arbeit werden die Metriken für p = 1 und p = 2 verwendet. Sie spielen eine zentrale Rolle bei dem Vergleich von kontinuierlichen Räumen und gitternetzbasierten Räumen: • L1: Die Manhattan-Metrik wird so genannt, da sie in R2 mit der Länge eines Pfades korrespondiert, der sich entlang eines achsenausgerichteten Gitters bewegt. 46 2 Grundlagen • L2: die euklidische Metrik, die der euklidischen Distanz entspricht Der Fall p = 2 kann auch über den Betrag eines Vektors ausgedrückt werden, die sogenannte euklidische Norm. Für die L2-Metrik gilt dann ρ(x,y) = ‖x− y‖ (vgl. [LaV06] S. 187). Kollisionserkennung Die Erkennung von Kollisionen zwischen zwei Objekten im Konfigurations- raum ist eine wichtige Komponente bei der Bewegungsplanung. Da in sehr vielen Bewegungsplanungsalgorithmen die meiste Rechenzeit für die Kollisi- onserkennung aufgewendet wird, erhöht sich die Relevanz der genaueren Betrachtung der Problemstellung. Für den Fall eines zweidimensionalen Weltmodells und konvex geformter Objekte gibt es glücklicherweise einen Algorithmus mit linearer Laufzeit (vgl. [LaV06] S. 209). Kollisionserkennung als logisches Prädikat Kollisionserkennung lässt sich als logisches Prädikat betrachten, das als Funktion φ : C → {TRUE,FALSE} in Erscheinung tritt. Wenn eine Konfiguration q ∈ Cobs, dann ist φ(q) = TRUE, andernfalls ist φ(q) = FALSE. Abstand zweier Mengen Neben der grundsätzlichen Information, ob eine Kollision vorliegt, ist auch der Abstand zweier Objekte eine wichtige In- formation für Planungsalgorithmen. Eine sogenannte Distanzfunktion ist als d : C → [0,∞) definiert, derenWert die Distanz imWeltmodellW abbildet, die zwischen dem sich am nächsten liegenden Punktpaar aller Punktpaare aus A(q) und O existiert. Im Allgemeinen ist die Distanz zweier geschlossener, begrenzter Teilmengen E und F au{s Rn w{ie folgt de}fi}niert: ρ(E,F) =min min ‖e− f ‖ . e∈E f∈F Dabei ist ‖ · ‖ die euklidische Norm. Wenn E ∩ F 6= ∅, dann ist ρ(E,F) = 0. Kollisionserkennung in zwei PhasenWenn sich in einemWeltmodell eine große Anzahl von Objekten befindet, dann kann es hilfreich sein, die Kolli- sionserkennung in zwei Phasen zu unterteilen und so die Komplexität und den Berechnungsaufwand einzugrenzen: • Weitphase In der umfassendenWeitphase sollen aufwändige detaillierte Berechnungen vermieden werden, indem Objekte ausgeschlossen wer- den, die weit voneinander entfernt sind. Dies geschieht in der Regel durch vereinfachende Datenstrukturen (Bounding Boxes) oder den Ein- satz von Hashing-Methoden. • Nahphase In der Nahphase werden individuelle Objektpaare im Detail verglichen, sodass eine genaue Kollisionserkennung durchgeführt wird. 2.4 Planung und Verwaltung von Objektbewegungen 47 Das Konzept für eine zweiphasige Vorgehensweise basiert auf der Er- kenntnis, dass der Berechnungsaufwand für die Bewegungsplanung einen sehr großen Einfluss auf die praktische Anwendbarkeit eines spezifischen Algorithmus haben kann. Kollisionserkennung für kontinuierliche Pfade Kollisionserkennungsalgo- rithmen stellen fest, ob eine Konfiguration (an einem Punkt im Raum) in C f ree liegt, aber Bewegungsplanungsalgorithmen erfordern, dass ein gesamter Pfad in C f ree abgebildet wird. Die Schnittstelle zwischen der Bewegungspla- nung und der Kollisionserkennung beinhaltet in der Regel die Validierung eines Pfadsegments. Dies kann nicht Punkt für Punkt überprüft werden, da dies eine unendlich große Anzahl von Aufrufen des Kollisionserkennungsal- gorithmus erfordern würde. Angenommen, ein Pfad τ : [0,1]→ C muss geprüft werden, um festzustel- len, ob τ([0,1]) ⊂ C f ree. Ein üblicher Ansatz besteht darin, das Intervall [0,1] stichprobenartig abzutasten und die Kollisionserkennung nur für die Abtast- werte aufzurufen. In der Praxis wird häufig als Auflösung der Abtastrate ein festes ∆q > 0 als Schrittweite im Konfigurationsraum gewählt. Die Punkte t1, t2 ∈ [0,1] werden so gewählt, dass sie nahe genug beieinander liegen, um sicherzustellen, dass ρ(τ(t1),τ(t2)) ≥ ∆q ist, wobei ρ eine Metrik auf C ist. Der Wert von ∆q wird oft experimentell bestimmt. Ist ∆q zu klein, wird viel Zeit mit der Kollisionserkennung vergeudet. Wenn ∆q zu groß ist, besteht die Möglichkeit, dass ein dünnes Hindernis auf dem Pfad nicht erkannt wird (vgl. [LaV06] S. 214). 2.4.4 Zeitabhängige Bewegungsplanung Bislang wurde das Problem der Bewegungsplanung in dieser Arbeit zeitlich unabhängig betrachtet und davon ausgegangen, dass sich genau ein Objekt im Weltmodell bewegt und alle anderen Objekte stationär die Hindernisregi- on O bilden. Wenn jedoch von einem dynamischen Weltmodell ausgegangen wird, in dem Objekte über die Zeit ihren Standort verändern, dann entsteht eine neue Komplexität in der Bewegungsplanung. Das Hinzuziehen der Zeit ermöglicht die Betrachtung kinodynamischer Eigenschaften wie Geschwin- digkeit und Beschleunigung sowie die Koordination der Bewegungsplanung für mehr als ein Objekt. Formale Problemstellung zeitabhängiger Bewegungsplanung Sei T ⊂R ein Zeitintervall, das beschränkt als T = [0, t f ] und unbeschränkt als T = [0,∞) geschrieben werden kann. Dabei ist 0 der Initialzeitpunkt und t f der Endzeitpunkt im beschränkten Fall. Sei der Zustandsraum Z als Z = C × T definiert, wobei C der Konfigurati- onsraum eines bewegten Objekts wie in Abschnitt 2.4.3 beschrieben ist. Ein 48 2 Grundlagen Zustand z wird als Zustandsvektor z = (q, t) repräsentiert und besteht aus einer Konfiguration q und einem Zeitpunkt t als Komponenten. Die Beson- derheit der Zeit ist, dass sie immer voranschreitet. Daher sind insbesondere die Pfade in Z gezwungen, sich in der Zeit vorwärts zu bewegen. Im Folgen- den soll die formale Problemstellung aus Abschnitt 2.4.3 als zeitabhängige Version dargestellt werden. Die Komponenten können wie folgt aufgelistet werden: • ein WeltmodellW = R2 • ein Zeitintervall T = [0, t f ] oder T = [0,∞) • eine Hindernisregion O(t) ⊂W für jedes t ∈ T Es wird angenommen, dass die Hindernisregion eine endliche Menge starrer Körper ist, die kontinuierlichen, zeitabhängigen Transformationen unterliegt. • ein bewegtes Objekt A und sein Konfigurationsraum C • der ZustandsraumZ als kartesisches ProduktZ = C ×T und ein Zustand z, der als Zustandsvektor z = (q, t) repräsentiert wird und aus einer Konfiguration q und einem Zeitpunkt t besteht • eine Hindernisregion Zobs innerhalb des Zustandsraums definiert als Zobs = {(q, t) ∈ Z | A(q) ∩O(t) 6= ∅} • ein freier Raum Z f ree = Z\Zobs innerhalb des Zustandsraums • Cobs(t) und C f ree(t) für jedes t∈ Tmit Cobs(t) = {q∈ C | A(q)∩O(t) 6= ∅} und C f ree = C\Cobs • ein Initialzustand zi ∈ Z f ree mit zi = (qi,0) für eine qi ∈ C f ree(0) • eine stationäre Zielkonfiguration qg ∈ C, die als Zielregion Zg ⊂ Z f ree abgebildet ist, wobei Zg = {(qg, t) ∈ Z f ree | t ∈ T} Ein vollständiger Algorithmus muss einen kontinuierlichen, zeitlich mono- tonen Pfad τ[0,1]→Z f ree berechnen, so dass τ(0) = zi und τ(1) ∈ Zg, oder korrekt zurückgeben, dass solch ein Pfad nicht existiert. Die zeitliche Mo- notonie impliziert für jedes Paar s1, s2 ∈ [0,1] mit s1 < s2, dass t1 < t2 und τ(s1) = (q1, t1) sowie τ(s2) = (q2, t2). In der allgemeinen Problemstellung für zeitabhängige Bewegungsplanung gibt es keine zusätzlichen Beschränkungen für den Pfad τ, was bedeutet, dass das Bewegungsmodell unendliche Beschleunigung und unbegrenzte Geschwindigkeit für Objekte zulässt. Die Geschwindigkeit kann sich augen- blicklich ändern, aber der Weg durch C muss immer kontinuierlich sein. Stückweise lineare Bewegung Ein für diese Arbeit relevantes Beispiel für die Art und Weise, wie eine zeitabhängige Bewegungsplanung umgesetzt werden kann, ist die Verwendung eines stückweise linearen Bewegungsmodells, 2.4 Planung und Verwaltung von Objektbewegungen 49 bei dem die Transformationen von A und O auf Basis einer stückweise linea- ren Funktion der Zeit durchgeführt werden. Da es sich um ein lineares Bewe- gungsmodell handelt, wird ein Punkt (x,y) durch (x+ c1t,y+ c2t)mit den Konstanten c1, c2 ∈R transformiert. Bei einer stückweise linearen Funktion können die Konstanten zu einer endlichen Anzahl an kritischen Zeitpunkten geändert werden. Zwischen diesen Zeitpunkten bleibt die Funktion linear (vgl. [LaV06] S. 314). Trennung von Bahnplanung und Bewegungssteuerung Für das in dieser Arbeit entwickelte Verfahren soll als Grundlage dieMethode der Geschwindigkeitsanpassung (engl. velocity tuning) beschrieben werden. Die Grundidee besteht darin, die Lösung der Problemstellung in C × T in die Bahnplanung und die zeitliche Bewegungsplanung aufzuteilen. Dabei wird davon ausgegangen, dass es stationäre Hindernisse gibt, die durch einen geplanten Pfad τ : [0,1]→C f ree umgangen werden. Dazu werden in der ersten Phase die klassischenMethoden der Bahnplanung ohne zeitliche Abhängigkeiten verwendet. Die zeitliche Bewegungsplanung wird in der zweiten Phase auf den neu generierten Pfad angewandt. Dies geschieht durch den Entwurf einer Zeit- steuerungsfunktion σ : T→ [0,1], die für jede Zeit t die Position des bewegten Objekts A auf dem Pfad τ beschreibt. Dies wird durch eine Komposition φ = τ ◦ σ erreicht, die T über [0,1] nach C f ree abbildet. Daher ist φ : T→ C f ree. Die Konfiguration zum Zeitpunkt t ∈ T ist durch φ(t) = τ(σ(t)) gegeben (vgl. [LaV06] S. 317). Sei S = [0,1] der Definitionsbereich von τ. Dann kann ein Zustandsraum Z = T × S definiert werden, in dem jeder Punkt (t, s) einen Zeitpunkt t ∈ T und eine Position s ∈ [0,1] auf dem Pfad indiziert. Die Hindernisregion wird wie folgt definiert: Zobs = {(t, s) ∈ Z | A(τ(s)) ∩O(t) 6= ∅}. Der freie Raum ist als Z f ree = Z\Zobs definiert. Die Planungsaufgabe für die Bewegungssteuerung besteht darin, einen kontinuierlichen Pfad g : [0,1]→ Z f ree zu finden (vgl. [LaV06] S. 318). 2.4.5 Bewegungsplanung für mehrere Objekte Die Planung der Bewegung mehrerer Objekte in einer WeltW erfordert nicht nur die Vermeidung von Kollisionen mit der Hindernisregion O, sondern auch die Koordination einer kollisionsfreien Bewegung der Objekte unter- einander. Angenommen, es soll die Bewegung von m Objekten A1, . . . ,Am geplant werden. Dann hat jedes Objekt Ai einen assoziierten Konfigurations- raum C i und jeweils eine eigene Initialkonfiguration qiinit und Zielkonfigura- 50 2 Grundlagen tion qiziel . Formale Problemstellung Der Zustandsraum wird so definiert, dass er die Konfigurationen aller bewegten Objekte gleichzeitig abbildet: Z = C1 × C2 × · · · × Cm. Ein Zustand z ∈ Z beinhaltet die Konfiguration aller Objekte und kann als z = (q1,q2, . . . ,qm) geschrieben werden. Die Dimension von Z ist durch N = ∑mi=1 dim(C i) gegeben. Es gibt zwei Hindernisregionen im Zustandsraum: Die eine entsteht durch die Kollisionen mit statischen Objekten und die andere entsteht mit anderen bewegten Objekten. Für die Kollisionen mit statischen Objekten wird die Hindernisregion für jedes Objekt Ai bei 1≤ i ≤ m durch die Untermenge Z iobs = {x ∈ Z | A i(qi) ∩O 6= ∅} definiert. Für die Definition der Hindernisregion zwischen den bewegten Objekten kann für jedes Paar Ai und Aj die Untermenge ij Zobs = {z ∈Z | A i(qi) ∩Aj(qj) 6= ∅} definiert werden. Beide Formeln werden in der folgenden formalen Beschrei- bung der Problemstellung für die Bewegungsplanung mehrerer Objekte kombiniert (vgl. [LaV06] S. 319): • ein WeltmodellW = R2 • eine Hindernisregion O ⊂W • die bewegten Objekte A1, . . . ,Am • ein Konfigurationsraum C i mit i von 1 bis m für jedes bewegte Objekt • ein ZustandsraumZ , der als kartesisches ProduktZ = C1×C2× · · ·×Cm definiert ist • eine Hindernisregion in Z(, die als⋃ )⋃ m ⋃ Z = Z iobs obs Z ij obs i=1 ij, i 6=j definiert wird Dabei sind Z i und Z ijobs obs jeweils die einzelnen Hindernisregionen für statische und bewegte Objekte • der freie Zustandsraum Z f ree = Z\Zobs • ein Initialzustand Zinit ∈ Z f ree, der die Initialkonfigurationen zinit = (q1init, . . . ,q m init) aller bewegten Objekte beinhaltet 2.4 Planung und Verwaltung von Objektbewegungen 51 • ein Zielzustand zziel inZ f ree, der die Zielkonfigurationen zziel = (q1ziel , . . . ,q m ziel) aller bewegten Objekte beinhaltet Die Planungsaufgabe besteht darin, dass ein kontinuierlicher Pfad τ : [0,1]→ Z f ree berechnet werden muss, so dass τ(0) = zinit und τ(1) ∈ zziel . Dabei beinhaltet dieser Pfad durch die besondere Konstruktion vonZ alle einzelnen Pfade im freien Raum aller bewegten Objekte. Durch diese formal einfache Darstellung wirkt die Problemstellung ähn- lich wie die für ein einzelnes bewegtes Objekt. Jedoch wächst die Dimension von Z linear mit der Anzahl der bewegten Objekte, während ein vollständi- ger Algorithmus zur Lösung der Problemstellung im besten Fall eine expo- nentielle Laufzeit erreichen kann. Selbst für viele stichprobenbasierte Algo- rithmen kann die Dimension bei vielen Objekten in der Praxis ein Problem darstellen (vgl. [LaV06] S. 320). Entkoppelte und priorisierte Planung Das Konzept der sogenannten entkoppelten Planung unterteilt die Problem- lösung in mehrere Phasen. Zuerst werden die Bewegungen für die einzel- nen Objekte entworfen, wobei die Interaktionen zwischen den bewegten Objekten zunächst ignoriert werden. In der nächsten Phase werden diese Wechselwirkungen berücksichtigt, jedoch sind die Wahlmöglichkeiten für den Algorithmus durch die bereits entworfenen Pfade eingeschränkt. Übli- cherweise können Entscheidungen aus der ersten Phase in der zweiten Phase nicht mehr rückgängig gemacht werden. Daher geht die Vollständigkeit des Algorithmus in der Regel verloren. Dennoch liefert die entkoppelte Planung in der praktischen Anwendung gute Ergebnisse, und in einigen Fällen kann die Vollständigkeit wiederhergestellt werden (vgl. [LaV06] S. 322). Ein einfacher Ansatz für eine entkoppelte Planung besteht darin, die bewegten Objekte nach Priorität zu sortieren und die Objekte mit höherer Priorität zuerst einzeln zu planen. Dieser Ansatz der priorisierten Planung geht davon aus, dass die Planung für ein Objekt mit niedriger Priorität alle Objekte mit höherer Priorität als sich bewegende Hindernisse ansieht. Angenommen, die bewegten Objekte sind durch ihre Indizes in abstei- gender Reihenfolge durch A1, . . . ,Am sortiert. Der Ansatz der prioritären Planung geht induktiv wie folgt vor: • Induktionsanfang: Für das erste Objekt A1 wird mit einem der klassi- schen Algorithmen ein kollisionsfreier Pfad τ : [0,1]→ C11 f ree berechnet. Anschließend wird eine Zeitsteuerungsfunktion σ1 bestimmt, sodass φ1 = τ1 ◦ σ1 : T→ C1f ree berechnet werden kann. • Induktionsschritt: Angenommen, es wurden bereits die Wegzeitfunk- tionen φ1, . . .φi−1 für die Objekte A1, . . . ,Ai−1 bestimmt, sodass keine Kollisionen zwischen den Objekten entstehen. Für jedes t ∈ T und 52 2 Grundlagen j ∈ {1, . . . , i− 1} können die Belegungen imWeltmodell Aj(φj(t)) ⊂W bestimmt werden, die als Untermenge der Hindernisregion O(t) angese- hen werden können. Auf dieser Basis werden für das ObjektAi ein neuer kollisionsfreier Pfad τi und eine Zeitsteuerungsfunktion σi berechnet, die zusammen φi = τi ◦ σi bilden. Dieser Ansatz ist nach LaValle in der Praxis erfolgreich, jedoch muss für dieses Verfahren der Verlust der Vollständigkeit des Lösungsraums in Kauf genommen werden (vgl. [LaV06] S. 322). Vorgeplante, festgelegte Pfade und der Koordinationsraum Ein besonde- rer Fall der priorisierten Planung ist, in der ersten Phase alle Pfade τ1, . . . ,τm zu planen und in der zweiten Phase in jedem Induktionsschritt eine Ge- schwindigkeitsanpassung durch die Bestimmung der Zeitsteuerungsfunkti- on σi vorzunehmen. Diese Vorgehensweise schränkt die Wahlmöglichkeiten zur Lösungsfindung weiter ein, aber erzeugt ein 2D-Planungsproblem, das einfach zu lösen ist (vgl. [LaV06] S. 322). Die grundlegende Idee der festgelegten Pfade, die unabhängig von der Geschwindigkeitssteuerung bestimmt werden, wirdmit demKonzept des Ko- ordinationsraums weiterentwickelt. Da der eigentliche Konfliktbereich zweier Objekte zylinderförmig und örtlich begrenzt ist, können mit stichproben- basierten Algorithmen in der Praxis gute Ergebnisse erzielt werden. Eine einfache Methode ist die Verwendung einer gitterbasierten Datenstruktur, um die Suche nach Konfliktbereichen zu unterstützen (vgl. [LaV06] S. 325). Festgelegte Straßenkarten und die sichereGaragenkonfiguration Einewei- tere Spezialisierung der festgelegten Pfade ist die Verwendung einer Straßen- karte oder eines topologischen Graphen. Hier kann die einfache Wegfindung über klassische Verfahren wie den Algorithmus von Dijkstra erfolgen. Der resultierende Koordinationsraum ist dann für jedes Objekt eindimensional, da auf den gefundenen kürzesten Pfad begrenzt. Hier ist nicht mehr die Wegfindung das Planungsproblem, sondern die Koordination steht im Fokus der Problembetrachtung. Ein Weg zu einem vollständigen Algorithmus ist die Einführung des Kon- zepts der sicheren Garagenkonfiguration qi für jedes bewegte Objekt Ai, in der eine Kollision mit anderen Objekten ausgeschlossen werden kann. Wenn qi von jedem Initialzustand zinit erreichbar ist und als Zielkonfiguration ver- wendet wird, dann kann ein vollständiger Planungsalgorithmus entwickelt werden (vgl. [LaV06] S. 325). 2.4.6 Planung unter differenziellen Zwangsbedingungen Bei der vorangegangenen Betrachtung der Bewegungsplanung wurde davon ausgegangen, dass ein Weg zwischen zwei beliebigen Konfigurationen ohne 2.4 Planung und Verwaltung von Objektbewegungen 53 Hindernisse einfach ermittelt werden kann. Der auf Stichproben basierende Ansatz, der Straßenkarten verwendet, geht beispielsweise davon aus, dass zwei nahe zueinander gelegene Konfigurationen im Konfigurationsraum direkt miteinander verbunden werden können. Solche Pfadbeschränkungen sind global in dem Sinne, dass sie sich nur auf die Menge der zulässigen Konfigurationen beziehen, die den freien Konfigurationsraum bilden. Differenzielle Zwangsbedingungen treten grundsätzlich überall dort auf, wo sich physische Objekte bewegen. Sie ergeben sich aus der Kinematik und Dynamik eines mechanischen Systems und führen dazu, dass die zulässigen Geschwindigkeiten an jedem Punkt lokal begrenzt sind. Ein gängiger Ansatz besteht darin, sie bei der Bewegungsplanung einfach zu ignorieren und zu hoffen, dass untergeordnete Steuerungstechniken sie so handhaben können, dass ein berechneter Pfad dennoch so genau wie möglich ausgeführt wird. Ein besserer, aber aufwändigerer Ansatz besteht darin, differenzielle Beschränkungen in den Entwurfsprozess einzubeziehen, damit die berechneten Bahnen den natürlichen Bewegungsmöglichkeiten eines mechanischen Systems entsprechen (vgl. [LaV06] S. 713). Differenzielle ModellierungModelle mit differenziellen Randbedingungen werden im Allgemeinen über ż = f (z,u) dargestellt. Dies ist das zeitkontinuierliche Gegenstück zur Zustandsüber- gangsfunktion zk+1 = f (zk,uk). Im Unterschied zur diskreten Version der Funktion liefert f (z,u) im zeitkontinuierlichen Fall einen Geschwindigkeits- vektor und nicht den nächsten Zustand. Da die Zustandsübergänge nicht diskret betrachtet werden können, wird ein zukünftiger Zustand, der dif- ferenziellen Zwangsbedingungen genügt, über die Ableitung nach dem Geschwindigkeitsvektor erzeugt. Daher ist es naheliegend, nur Geschwin- digkeiten anzugeben. Dies beruht auf den Konzepten der Tangentenräume und Vektorfelder (vgl. [LaV06] S. 715). Ein für diese Arbeit relevantes Beispiel für einen solchen Tangentenraum kann für die Annahme C = R2 gegeben werden. Eine Konfiguration wird als q = (x,y) ∈R2 geschrieben, während ein Geschwindigkeitsvektor als (ẋ, ẏ) ausgedrückt wird. Jedes (ẋ, ẏ) ist Element des Tangentenraums T (R2q ), der als zweidimensionaler Vektorraum an jedem Punkt (x,y) ∈R2 definiert ist. Zu Abbildung der Zwangsbedingungen wird für jedes q ∈R2 die Menge der gültigen Geschwindigkeitsvektoren U(q) ⊂ T 2q(R ) gebildet (vgl. [LaV06] S. 716). Damit das mathematische Konzept der Ableitung nach Position und Zeit im Allgemeinen möglich wird, ist es erforderlich, dass C nicht nur eine to- pologische Mannigfaltigkeit, sondern darüber hinaus auch eine sogenannte 54 2 Grundlagen differenzierbare Mannigfaltigkeit ist und sich lokal wie ein euklidischer Raum verhält (vgl. [LaV06] S. 716). Damit ergibt sich die Verbindung zur klassischen Mechanik und ihren Teilgebieten. Zur Bewegungsplanung können Modelle der Newtonschen Mechanik, des Lagrange-Formalismus und der Hamil- tonschen Mechanik (z. B. chaotische Bewegung von Partikeln) verwendet werden. Aus der Hamiltonschen Mechanik stammt das Konzept des Phasenraums, das dazu genutzt werden kann, Zwangsbedingungen für Ableitungen hö- herer Ordnung (Beschleunigung, Ruck usw.) auf die Ableitung erster Ord- nung, also Beschränkungen der Geschwindigkeit zu reduzieren. Dies wird allerdings durch eine erhöhte Dimension des Zustandsraums erkauft (vgl. [LaV06] S. 715). Das spezifische Konzept der Nutzung von Geschwindigkeits- beschränkungen als Ersatz für Zwangsbedingungen der Beschleunigung wird in dieser Arbeit verwendet. Stichprobengestützte Planung unter differenziellen Zwangsbedingungen Laut LaValle gibt es im Allgemeinen keine kombinatorischen Ansätze für Modelle mit differenziellen Zwangsbedingungen, sodass entsprechende Al- gorithmen nur in äußerst begrenzten Fällen existieren. Modellen mit diffe- renziellen Zwangsbedingungen fehlen die meisten der nützlichen mathema- tischen Eigenschaften, die für kombinatorische Ansätze erforderlich sind. Grundsätzlich wird die Entwicklung von Algorithmen durch die Diskretisie- rung von drei Räumen (Zustandsraum, Aktionsraum und Zeit) erschwert (vgl. [LaV06] S. 713). Daher sollen in diesem Abschnitt einige Grundlagen und Methoden der stichprobengestützten Bewegungsplanung vorgestellt werden, die differen- zielle Zwangsbedingungen ermöglichen. Dabei werden die Unterschiede und Gemeinsamkeiten zwischen den Begriffen der kinodynamischen Planung und der Trajektorienplanung vorgestellt. Der in der Literatur wichtige Fall der nicht-holonomischen Planung wird im Rahmen dieser Arbeit nicht weiter verfolgt und daher hier nicht vorgestellt (vgl. [LaV06] S. 787). Formale Problemstellung Es wird angenommen, dass die differenziellen Zwangsbedingungen in einer Zustandsübergangsgleichung ż = f (z,u) auf einer differenzierbaren Mannigfaltigkeit Z , dem Zustandsraum, ausgedrückt werden, der ein Konfigurationsraum C oder ein Phasenraum eines Konfigu- rationsraums sein kann. Eine Lösung wird nicht direkt als Pfad ausgedrückt, sondern durch Integration der Zustandsübergangsgleichung aus einer Akti- onstrajektorie abgeleitet. Die Aktionstrajektorie basiert für den allgemeinen Fall auf dem Aktions- raum U ⊂ Rm. Ein Planungsalgorithmus berechnet die Aktionstrajektorie ũ, die über die Funktion ũ : [0,∞)→ U definiert ist. Eine einzelne Aktion 2.4 Planung und Verwaltung von Objektbewegungen 55 am Zeitpunkt t wird durch u(t) ∈U(z(t)) ⊂U ausgedrückt, womit die Ab- hängigkeit der möglichen Aktionen vom Zustandsraum abgebildet wird. Es wird angenommen, dass eine terminierende Aktion uT verwendet wird, die zu einem Zeitpunkt tF angewendet wird. Die Verbindung zwischen Aktions- und Zustandsraum wird durch folgen- de Definition einer Zustandstrajektor∫ie geschaffen:t z(t) = z(0) + f (z(t′),u(t′))dt′ 0 integriert die Zustandsübergangsgleichung ż = f (z,u) aus dem Initialzu- stand z(0). Mit z̃(z(0), ũ) sei die Zustandstrajektorie über alle Zeiten definiert. Wenn u für jede Zeit t festgelegt ist, dann definiert ż = f (z,u) ein statisches Vektorfeld (vgl. [LaV06] S. 789). Die formale Problemstellung lässt sich aus den vorherigen Problemstellun- gen in den Unterabschnitten Abschnitt 2.4.3 und Abschnitt 2.4.4 kombinieren und erweitern: • ein WeltmodellW ∈R2 • ein bewegtes Objekt A • eine Hindernisregion O ⊂W • ein Konfigurationsraum C • ein unbegrenztes Zeitintervall T = [0,∞) • ein Zustandsraum Z , der als differenzierbare Mannigfaltigkeit definiert ist und der Z = C oder als abgeleiteter Phasenraum von C definiert werden kann • eine Hindernisregion Zobs und der freie Zustandsraum Z f ree = Z\Zobs, der alle Zustände enthält, die Kollisionen vermeiden und alle Zwangsbe- dingungen einhalten • Für jeden Zustand z ∈ Z gibt es einen beschränkten Aktionsraum U(z) ⊆Rm ∪ {uT}mit m als feste Anzahl an Aktionsvariablen und uT als Terminierungsaktion. Sei U die Vereinigung aller U(z) über alle z ∈ Z . • eine Zustandsübergangsgleichung ż = f (z,u), die für alle z ∈ Z und u ∈U(z) definiert ist • ein Initialzustand zI ∈ Z f ree • eine Zielmenge ZG ⊂ Z f ree Ein vollständiger Algorithmus berechnet eine Aktionstrajektorie ũ : T→U, aus der eine Zustandstrajektorie z̃ gebildet werden kann, bei der z(0) = zI ist, für die ein t > 0 mit u(t) = uT existiert und für die es ein z(t) ∈ ZG gibt (vgl. [LaV06] S. 790). Eine formale Besonderheit in dieser Problemstellung ist die Verwendung der Terminierungsaktion uT . Sobald sie ausgeführt wird, bleibt der erreichte 56 2 Grundlagen Zustand unverändert. Dabei wird angenommen, dass die Geschwindigkeits- vektoren in ZG null sind, sodass das physische Objekt nach Durchführung der Bewegung in dieser Endposition verbleibt. KomplexitätDie Bewegungsplanung unter differenziellen Zwangsbedingun- gen gilt als extrem schwierige Problemstellung (vgl. [LaV06] S. 790). Schon die Standardproblemstellung aus Abschnitt 2.4.3 ist PSPACE-hart. Daher sind die überwiegenden praktisch anwendbaren Lösungsansätze stichpro- benbasiert. Region der unvermeidlichen Kollision Ein große Herausforderung bei der Bewegungsplanung von hochdynami- schen Systemen ist die Berücksichtigung der sogenannten Region der un- vermeidlichen Kollision (engl. region of inevitable collision, RIC). Diese ist definiert als die Menge von Zuständen Zric, aus denen heraus ein Eintritt in die Hindernisregion Zobs unvermeidlich ist. Wenn sich ein Objekt mit hoher Geschwindigkeit auf ein Hindernis zubewegt, dann wird ab einem Punkt eine Kollision eintreten, unabhängig davon, ob Brems- oder Ausweich- manöver eingeleitet werden. Bei sehr geringen Geschwindigkeiten sind in der Praxis Zric und Zobs ungefähr deckungsgleich, da ein Objekt in jedem Fall schnell genug zum Stillstand gebracht werden kann. Bei steigenden Geschwindigkeiten wächst Zric jedoch dramatisch an (vgl. [LaV06] S. 796). Kinodynamische Planung und Trajektorienplanung Der Begriff der kinodynamischen Planung bezieht sich auf Planungsprobleme, für die Geschwindigkeits- und Beschleunigungsgrenzen eingehalten wer- den müssen. Es handelt sich hierbei um Zwangsbedingungen der zweiten Ordnung auf dem Konfigurationsraum C. Der Begriff der Trajektorienplanung wird häufig synonym zur kinodynamischen Planung verwendet. Historisch gesehen verbindet sich mit der Trajektorienplanung ein Ansatz der entkop- pelten Planung, bei dem zuerst ein Pfad durch C f ree geplant wird, für den anschließend ein Geschwindigkeitsprofil erstellt wird, das den Zwangsbe- dingungen genügt (vgl. [LaV06] S. 792). Entkoppelte Trajektorienplanung Schon bei der Betrachtung einfacher dynamischer Plaungsprobleme in Ab- schnitt 2.4.4 und bei der Planung für mehrere Objekte in Abschnitt 2.4.5 wurde die entkoppelte Planung besprochen. Auch wenn sich die Möglichkei- ten moderner Hardware für den Einsatz ganzheitlicher Planungsalgorithmen eignen, kann ein entkoppelter Einsatz notwendig werden, wenn Lösungen durch aufwändige numerische Integration, Kollisionserkennung oder hoch- dimensionale Hindernisregionen zu rechenintensiv werden (vgl. [LaV06] S. 841). 2.4 Planung und Verwaltung von Objektbewegungen 57 Idealerweise ist das Ziel einer Methode die Erstellung eines Bewegungs- plans, der durch eine Regelungseinrichtung direkt ausgeführt werden kann und dabei Hindernisse vermeidet und differenzielle Zwangsbedingungen einhält. Eine besondere Annahme dabei ist, dass der tatsächliche Zustand eines bewegten Objekts zuverlässig und genau gemessen werden kann. Eine typische Vorgehensweise für einen entkoppelten Ansatz wird nach LaValle in vier unterschiedliche Module unterteilt: • Verwende einen einfachen Planungsalgorithmus zur Bestimmung eines kollisionsfreien Pfades τ : [0,1]→ C f ree. • Transformiere τ in einen neuen Pfad τ′, der die differenziellen Zwangs- bedingungen besser erfüllt. Dies kann beispielsweise durch eine Pfad- glättung erfolgen. • Berechne eine Zeitsteuerungsfunktion σ : [0, tF]→ [0,1] für τ′, sodass τ′ ◦ σ einen zeitparametrisierten Pfad durch C f ree bilden. Dieser Pfad muss den Anforderungen an die Zustandstrajektorie z̃ genügen und ż= F(z(t),u(t)) sowie u(t) ∈U(z(t)) für alle Zeitpunkte erfüllen, bis die terminierende Aktion uT zum Endzeitpunkt tF ausgeführt wird. • Entwirf eine Regeleinrichtung π : Z →U, die den Verlauf der geplanten Zustandstrajektorie z̃ in der physischen Realität mit möglichst geringem Fehler nachzubilden versucht. Durch diese Form der Entkopplung wird eine Dekomposition der Problem- stellung erreicht, die in der Praxis zu großen Einsparungen im Berechnungs- aufwand führen kann. Dies wird durch den Verlust der Vollständigkeit des Algorithmus erkauft, da nachteilige Entscheidungen in einem Modul in nachfolgenden Modulen zu unvorteilhaften Lösungen führen können (vgl. [LaV06] S. 841). Pfadbeschränkte Trajektorienplanung Angenommen, es existiert bereits ein geglätteter Pfad τ′ : [0,1]→ C f ree, der auf einem Pfad τ basiert, der durch einen Algorithmus berechnet oder per Hand gestaltet wurde. Das Ziel ist nun, eine Zustandstrajektorie z̃ zu bestim- men, die als Führungsgröße einer Regeleinrichtung dienen kann, wie sie in Abschnitt 2.1 für die Steuerung logistischer Systeme beschrieben wurde. Die dazugehörige Aufgabe ist die Bestimmung eines Geschwindigkeitsprofils entlang des Pfades, das die differenziellen Zwangsbedingungen im Zustands- raum Z einhält. Angenommen, dass jeder Zustand z ∈ Z eine Konfiguration in C sowie ihre zeitliche Ableitung repräsentiert, sodass z = (q, (̇q)). Wenn n die Dimension von C ist, dann hat Z entsprechend die Dimension 2n (vgl. [LaV06] S. 846). Sobald ein Pfad gegeben ist, können die Freiheitsgrade für die weitere Bewegungsplanung beschränkt werden, z. B. mit: 58 2 Grundlagen • die Position s ∈ [0,1] entlang des Pfades • die Geschwindigkeit ṡ = dsdt an jedem Punkt s Der vollständige Zustand z ∈ Z lässt sich aus s und ṡ rekonstruieren. Aus dieser Vorgehensweise heraus ergibt sich ein zweidimensionales Planungs- problem, bei dem alle Zustandsänderungen die Zwangsbedingungen der Gleichung ż = f (z,u) erfüllen müssen. Für die effiziente Lösung dieses Pro- blems gibt es zahlreiche Methoden, von denen viele ursprünglich für Robo- terarme entwickelt wurden (vgl. [LaV06] S. 846). Für die Betrachtung aller differenziellen Zwangsbedingungen im Konfigurationsraum C kann eine Gleichung in der folgenden Form aufgestellt werden: q̈ = h(q, q̇,u). Dabei sind n Aktionsvariablen u = (u1, . . . ,un) berücksichtigt. Die Beschleu- nigung in C ist vom Zustand z = (q, q̇) und der Aktion u abhängig. Das bewegte Objekt wird dabei als holonomisch angenommen und hat genug Freiheitsgrade, um einem spezifizierten Pfad zu folgen. LaValle zeigt, dass es möglich ist, die obige Gleichung mit den Positionen s auf dem Pfad und ihren Ableitungen ersten und zweiten Grades ṡ und s̈ in Beziehung zu setzen (vgl. [LaV06] S. 847ff). Dabei wird die Funktion h′(s, ṡ,u) definiert und als Gleichung q̈ = h′(s, ṡ,u) geschrieben, wobei der einzige Unterschied zur vorherigen Gleichung ist, dass z = (q, q̇) auf eine Untermenge von Z beschränkt ist, die durch An- wendung von Werten für s und ṡ erreicht werden können. Die Menge an möglichen Beschleunigungsvektoren, die durch u erreicht werden können, bleibt prinzipiell gleich. LaValle zeigt, dass für jedes ui mit i ∈ {1, . . . ,n} eine Zwangsbedingung in der Form 1 d2τ s̈ = h′i(s, ṡ,ui)− i ṡ22 (2.1)dτi/ds ds durch Auflösung nach s̈ erzeugt wird, sofern dτi/ds 6= 0 (vgl. [LaV06] S. 848). Eine Aktion u ∈ U führt nur dann dazu, dass dem Pfad τ gefolgt wird, wenn alle n Zwangsbedingungen basierend auf Gleichung 2.1 erfüllt sind. Aus diesemGrund sind alle Aktionen, die τ folgen, in einer eindimensionalen Untermenge vonU enthalten, da bei Wahl eines ui alle anderen n− 2 Aktions- variablen über Auflösung der ersten Gleichung nach s̈ und anschließendes Einsetzen bestimmt werden. Durch diese gegenseitige Abhängigkeit der Aktionsvariablen (u1, . . . ,un) können unter Umständen viele Fälle auftreten, in denen aus einem Zustand z keine geeigneten Aktionen u ∈U existieren, die zu einem korrekten Folgen 2.4 Planung und Verwaltung von Objektbewegungen 59 von τ führen. Durch das Einführen von geeigneten Zwangsbedingungen auf Z können solche Zustände ausgeschlossen werden (wie z. B. durch eine erlaubte Höchstgeschwindigkeit). Auch durch eine ungeeignete Wahl von τ können Fälle generiert werden, die dazu führen, dass ein Folgen des Pfades unmöglich wird. Abb. 2.16 Ein ungünstig gewählter Pfad für die pfadbeschränkte Trajektorienplanung Abbildung 2.16 zeigt einen ungünstig gewählten Pfad τ. An der Position τ(1/3) erreicht er eine Ecke, die dazu führt, dass τ nicht differenzierbar ist. Je nach Bewegungsmodell kann es unmöglich sein, an dieser Stelle dem Pfad zu folgen. Für holonomische Bewegungsmodelle ist es möglich, an dieser Stelle die Geschwindigkeit bis auf den Wert null zu reduzieren und dann wieder neu zu starten. Grundsätzlich ist es vorteilhaft, den Pfad in weichen Kurven zu führen, wobei eine sehr enge Kurve, wie sie in der Abbildung an Position τ(2/3) abgebildet ist, aufgrund der starken Krümmung zu einer niedrigen Geschwindigkeit führt, damit die Zentripetalbeschleunigung nicht zu hoch wird. Sieht man von dem Problem der schlecht gewählten Pfade ab, dann kann die Erzeugung eines optimalen Geschwindigkeitprofils effizient erfolgen. LaValle zeigt eine Mögllichkeit der Verwendung von dynamischer Program- mierung und, für die vorliegende Arbeit von Bedeutung, den zeitoptimalen Ansatz der sogenannten Bang-Bang-Methode. Die grundsätzliche Idee ist es, das Geschwindigkeitsprofil aus einer Sequenz der Bewegungsprimitive der maximalen Beschleunigung und der maximalen Verzögerung zu erzeugen (vgl. [LaV06] S. 852ff). Kapitel 3 Axiomatik der Logistik Zusammenfassung Das dritte Kapitel bildet die Grundlage für die Identi- fizierung der Forschungslücke, die mit dieser Arbeit geschlossen wird. Es wird eine Axiomatik der Logistik entwickelt, die Konzepte aus der Bewe- gungsplanung der Robotik mit logistischen Fachbegriffen verbindet. Es wird eine Neudefinition der Logistik auf Basis des Konzepts des logistischen Raums hergeleitet. Aus der Axiomatik ergibt sich die mögliche Struktur des logistischen Raums als Kontinuum zwischen einer gitterbasierten und einer kontinuierlichen Abbildung. Der ideale logistische Raum wird als Ex- tremwert einer kontinuierlichen Struktur identifiziert und semantisch dem idealisierten Förderwesen zugeordnet. Eine gitterbasierte Struktur wird dem idealisierten Lagerwesen zugeordnet. Anschließend wird das Konzept des Cyberphysischen Zwillings als Verbindung zwischen cyberphysischen Syste- men, Digitalem Zwilling und der Axiomatik der Logistik eingeführt. 61 62 3 Axiomatik der Logistik 3.1 Motivation für eine axiomatische Betrachtung Das Unterfangen, eine allgemeingültige Axiomatik der Logistik aufzustel- len, muss sich zunächst der Frage stellen, wozu es gebraucht wird, wenn es bereits eine Vielzahl von Strukturierungsansätzen für die logistische Wirk- lichkeit gibt, die ihre jeweilige nützliche Daseinsberechtigung führen (vgl. Abschnitt 2.1). Eine zweite Frage ist, warum eine Dissertation über eine Bewegungsplanung für Transportroboter an dieser Stelle der Arbeit – zwi- schen Grundlagen und Bestimmung der Forschungslücke – eine Axiomatik entwickelt. Der Ausgangspunkt der Überlegungen zur Entwicklung einer Axiomatik ist die intuitive Annahme, dass hinter den erfolgreichen Logistikanwendun- gen, die auf gitterbasierten Bewegungen basieren (vgl. das AutoStore-System in Abbildung 3.1a), ein grundlegendes Prinzip der Logistik steckt. Erweitert werden diese Überlegungen durch die Existenz schwarmbasierter Systeme, die sich frei bewegen können (vgl. das Loadrunner-System in Abbildung 3.1b) und ein Gegenbeispiel für ausschließlich gitterbasierte Bewegung zei- gen. Diese und andere Beispiele für moderne Logistikanwendungen geben jedoch nur Hinweise auf die mögliche Existenz grundlegender Prinzipien der Logistik. Es fehlt eine grundlegende, anwendungsunabhängige Betrach- tung, die Einzelproblemstellungen und Gesamtprobleme verbindet und den beteiligten Disziplinen und Fachbereichen (z. B. Informatik, Statistik, Auto- matisierungstechnik, Robotik) mit Vorgaben aus demGesamtzusammenhang der Logistik zuweist. Bisher füllt die Logistikforschung diese Rolle nur be- dingt. Vielmehr nimmt sie heutzutage die umgekehrte Synthesefunktion ein und beschränkt sich häufig auf ihre Rolle als Anwendungsdomäne. (a) (b) Abb. 3.1 (a) Gitterbasierte Bewegung am Beispiel AutoStore1[FS21] (b) Freie Bewegung am Beispiel des Loadrunners [ten+20] Der Anspruch einer zeitgemäßen Dissertation in der Logistikforschung muss es sein, dass sie die Herausforderungen und Probleme aus logistischer Sicht modelliert und strukturiert. Dabei soll die Betrachtung der Einzelproblem- 1 Quelle:©c AutoStore 3.1 Motivation für eine axiomatische Betrachtung 63 stellungen der beteiligten Disziplinen und Fachbereiche (in diesem Fall vor allem der Robotik) als Grundlage für eine übergeordnete Theorie der Logistik genutzt werden. Dies wird durch die Entwicklung einer Axiomatik ermög- licht. Die folgenden Annahmen werden in dieser Arbeit für den Entwurf der Axiomatik verwendet: • Ein logistisches Axiom ist ein intuitiv unmittelbar einleuchtender Grund- satz, der als Prinzip für eine im praktischen Arbeitsleben empirisch gut bestätigte Regel postuliert werden kann (nach dem klassischen und na- turwissenschaftlichen Axiombegriff). • In der Regel sind logistische Axiomensysteme evidenzbasiert und müs- sen nicht formal vollständig sein. • Ein logistisches Axiomensystem stellt die Grundlage für die Verkürzung der Wirklichkeit zur Verfügung, nach der logistische Modelle erstellt werden können. • Der Wert eines logistischen Axiomensystems zeigt sich erst in der Praxis. Es wird jedoch nicht die einzig allgemeingültige Axiomatik im Sinne der Naturwissenschaften gesucht, sondern eine Axiomatik, die für die meisten lo- gistischen Zielanwendungen einen hinreichenden Erkenntnisgewinn zulässt. Daher wären die Newtonschen Axiome ein gutes Beispiel für ein einfaches System, das hinreichend genau ist. Im Gegensatz dazu stehen Axiome der speziellen Relativitätstheorie oder der Quantenmechanik, die genauer sind, aber auch deutlich komplexer in ihrer Anwendung. Für die Logistik verhält sich dieser Umstand etwas anders: Die Grundbegriffe sind trivial und allge- mein bekannt, daher gibt es sie in vielen, leicht unterschiedlichen Stadien der Formalisierung. Dies bedeutet, dass bereits eine Vielzahl von intuitiven, klassischen Axiomensystemen für die Logistik existiert. Im Grunde lernt jedes Kind die Grundlagen einer logistischen Struktu- rierung des Raums anhand von Bauklötzen und anderem Spielzeug. Daher ist der klassische Axiombegriff – das unmittelbar einleuchtende Prinzip – für fast alle Menschen in logistisch wichtigen Angelegenheiten auf den ers- ten Blick einfach einzusehen. Dasselbe gilt für den naturwissenschaftlichen Axiombegriff, da die meisten logistischen Angelegenheiten alltäglich und vielfach empirisch bestätigt werden. Die offensichtliche Trivialität der anfänglich zu lösenden Problemstellun- gen und die allgemeine Verbreitung logistischer Anwendungen sorgen dafür, dass es eine große Zahl ähnlicher Axiomensysteme gibt, die in Software realisiert wurden. Alleine im deutschsprachigen Raum gibt es mehr als 100 Anbieter von Lagerverwaltungssystemen (vgl. [Sch+20]), deren Softwarepro- dukte im Grunde dieselbe logistische Problemstellung lösen. Die folgende Definition eines Gesetzes soll diesen Umstand darstellen, der einen Aspekt des Dilemmas der logistischen Standardisierung beschreibt. 64 3 Axiomatik der Logistik Gesetz über die Langlebigkeit pragmatischer Belanglosigkeit Je einfacher eine Sache von vielen Menschen beschrieben werden kann, die für eine pragmatische und in kurzer Zeit zu lösende Problem- stellung notwendig, aber nicht wichtig ist, desto zahlreicher werden inkompatible Ad-hoc-Definitionen dieser Sache entwickelt, für deren spätere Standardisierung aufgrund der relativen Belanglosigkeit kein Aufwand getrieben wird. Das Problem besteht also darin, dass in jeder logistischen Anwendungs- entwicklung implizit grundlegende Modelle und Definitionen der Logistik festgelegt werden, die spätere Entwicklungen behindern und deren Inkom- patibilität zu den impliziten Modellen anderer Anwendungen zu Schnittstel- lenproblemen führt, die nur durch hohen Aufwand behoben werden können. Die Prinzipien zu einer allgemeingültigen Axiomatik der Logistik lassen sich erfolgreich nur dann entwickeln, wenn diese Problematik ausreichend addressiert wird. Damit kann die erste der anfangs gestellten Fragen beantwortet werden. Erst eine explizit entwickelte Axiomatik der Logistik ermöglicht eine grund- sätzliche, übergeordnete Strukturierung der Logistik als regulatives Prinzip für die Entwicklung von standardisierten Gestaltungsmethoden. Eine ex- plizit entwickelte Axiomatik erleichtert die Betrachtung der Logistik als Wissenschaftsdisziplin, die Einzelproblemstellungen und Gesamtprobleme verbindet und den beteiligten Disziplinen Vorgaben aus dem Gesamtzusam- menhang der Logistik zuweisen kann. Die Beantwortung der zweiten Frage ergibt sich aus dem Wunsch, ein Verfahren der Bewegungsplanung für physische Objekte aus dem Gesamt- zusammenhang einer Axiomatik der Logistik heraus zu entwickeln. Der konkrete praktische Einsatz der in dieser Arbeit entwickelten Axiomatik ist die Ableitung von Prinzipien für gitterbasierte und freie Bewegung aus logistischen Axiomen heraus. Diese Prinzipien sollen miteinander in Re- lation gesetzt werden, sodass eine allgemeine anwendungsunabhängige Forschungslücke im Rahmen logistischer Bewegungsplanung bestimmt wer- den kann, die nicht mehr von einer anderen Fachdisziplin dominiert wird (in diesem Fall Robotik). 3.2 Aufbau der Axiomatik Die Begriffe der Logistik werden aus einer Betrachtung der Strukturierung des logistischen Raums entwickelt, die sich an der Theorie der Bewegungpla- nung aus der Robotik orientiert (vgl. Abschnitt 2.4.3). Es werden Axiome der Logistik aufgestellt, die auf mathematischen Konzepten der Topologie basie- ren, aus denen sich weitere Prinzipien der Logistik ableiten lassen. Anhand 3.2 Aufbau der Axiomatik 65 von Beispielen und Erläuterungen der Axiome werden die unterschiedli- chen Prinzipien erläutert und gezeigt, wie sich eine begriffliche Struktur der Logistik aus den Axiomen und in Zusammenhang mit den abgeleiteten Prinzipien entfaltet. Das Adjektiv logistisch wird im Rahmen der Axiomatik bereits vor einer Definition des Begriffs Logistik verwendet, um allgemein ver- wendete Begriffe, wie etwa den Raum, von den hier aufgestellten Begriffen zu unterscheiden. Strukturierung des Raums Der grundlegende Begriff der Axiomatik ist der logistische Raum mit dem dazugehörigen Prinzip von der Strukturierung des Raums. Der logistische Raum ist ein künstliches Gedankenkonstrukt, das die physische Wirklichkeit vereinfacht abbildet und eine allgemeine Beschreibung und Lösung von Problemstellungen und Charakteristiken logistischer Systeme ermöglicht. Er kann mathematisch alsMannigfaltigkeit aufgefasst werden, also als topo- logischer Raum, der lokal dem als euklidisch angenommenen physikalischen Raum gleicht (vgl. Abschnitt 2.4.3). Zugleich ist er auch ein soziales Kommu- nikationsmodell für die Koordination logistischen Handelns und häufig von einer pragmatischen Ungenauigkeit geprägt (z. B. die Anweisung: „Stell die Palette mit den grünen Kisten hinten links in die Ecke.“). Für die irdische Logistik kann die Sphäre der Erdkugel als grundsätzli- che Referenz-Mannigfaltigkeit angesehen werden. Hier wird jede Region als Karte im Koordinatenraum R2 auf eine Ebene abgebildet (siehe Abbil- dung 3.2). Die Menge aller Karten bildet die Oberfläche vollständig ab und wird Atlas genannt. Zwischen den Karten sind Übergänge definiert, die einen geordneten Kartenwechsel erlauben. Das Beispiel der Kartierung der Erde ist sehr anschaulich, aber auch in- sofern irreführend, als es die klassische geographische Strukturierung des Raums mit vermessungstechnischer Genauigkeit suggeriert. Am Beispiel ei- ner Mobilfunkzelle lässt sich eine andere Art von Strukturierung des Raums veranschaulichen, die sich an einer kabellosen Kommunikationsinfrastruktur orientiert. Abbildung 3.3a illustriert einen Mobilfunkturm als Kern einer zellularen Struktur, die idealisiert gleichmäßig den physischen Raum ab- deckt, aber in der Wirklichkeit sehr irreguläre Formen annehmen kann (siehe Abbildung 3.3b). Betrachtet man Systeme der innerbetrieblichen Logistik, so kann man den logistischen Raum als Mannigfaltigkeit auffassen, indem die räumlichen Bereiche einzelner Gewerke die Karten eines Atlas bilden, der den Raum vollständig beschreibt (siehe Abbildung 3.4). 66 3 Axiomatik der Logistik 50° 90° 40° 90° 50° 90° Abb. 3.2 Die Erdoberfläche ist eine Mannigfaltigkeit, sie kann in einem Atlas über mehrere Karten dargestellt werden. (a) (b) Abb. 3.3 (a) Mobilfunkturm als Kern einer zellularen Struktur (b) Irreguläre Struktur von Mobilfunkzellen am Beispiel eines Voronoi-Diagramms Logistischer Raum Sei L ein logistischer Raum, U ⊂ L eine offene Teilmenge und A ⊂Rn eine offene Teilmenge des euklidischen Raums. Ein Atlas von Karten φ :U→ A, bestehend aus der Menge A = {(Ui,φi)|i ∈ I} von Karten auf L, deren Definitionsbereiche L überdecken, definiert den logisti- schen Raum als Mannigfaltigkeit. Die Karten des Atlas hängen über definierte Kartenübergänge zusammen. Die Lage der Karten zueinan- der sowie der spezifische Charakter der Kartenübergangsfunktionen bilden die Struktur des logistischen Raums. Der logistische Raum ist endlich. 3.2 Aufbau der Axiomatik 67 Ein so definierter logistischer Raum bildet eine Struktur, bestehend aus zu- sammenhängenden, vereinfachten Karten des physischen Raums innerhalb eines Gebäudes oder Firmengeländes. Der Ansatz über den Begriff der Man- nigfaltigkeit erlaubt eine grundlegende Definition, die sich einerseits gut mit der klassischen Aufteilung logistischer Systeme in Subsysteme verträgt und zugleich eine Basis für Anknüpfungspunkte zur Theorie der Bewegungspla- nung bietet (vgl. Abschnitt 2.4.3). Gassen des Hochregals Ui+1 Vorzone Ui Abb. 3.4 Der Atlas des Hochregallagers, bestehend aus verbindender Vorzone und Lagergassen, beschreibt die Mannigfaltigkeit des Systems. Die Struktur des logistischen Raums ergibt sich durch eine explizite Tren- nung in disjunkte Umgebungen. Die Möglichkeit, den Trennungsbegriff zu definieren, ergibt sich aus der euklidischen Metrik, die im logistischen Raum gilt. Dies bedeutet, dass Abstände zwischen zwei Punkten gemessen werden können und damit der Begriff der Umgebung definiert werden kann: Sei (Rn,d) ein euklidischer Raum mit der Metrik d. Eine Menge U ⊆ Rn heißt genau dann Umgebung von x ∈Rn, wenn es ein ε > 0 gibt, sodass für alle y ∈Rn mit d(x,y)< ε die Eigenschaft y ∈U erfüllt ist (siehe Abbildung 3.5a). Darauf aufbauend lässt sich das Trennungsaxiom für die Logistik definieren, das umgangssprachlich mit dem folgenen Sprichwort beschrieben werden kann: „Space is what stops everything from being in the same place. [Raum ist das, was die Dinge daran hindert, alle am selben Platz zu sein.]“ Das hier definierte Axiom der logistischen Trennung erweitert die Definition des haus- dorffschen Trennungsaxioms, nach dem ein topologischer Raum dann die Hausdorffeigenschaft hat, wenn für alle x,y ∈ M mit x 6= y disjunkte offene Umgebungen Ux und Uy existieren (siehe Abbildung 3.5b). Axiom der Trennung Seien x,y ∈ L Punkte im logistischen Raum und Ux,Uy ihre Umge- bungen, dann bilden die Formen Fx ⊂Ux,Fy ⊂Uy jeweils spezifische Untermengen ab. Sind die Formen disjunkt, dann heißen sie getrennt. Dieses Trennungsaxiom bildet zum einen die Grundlage für eine Definition logistischer Orte, Plätze und Objekte, und zum anderen kann auf seiner Basis eine lokale Nachbarschaft für physische Objekte definiert werden, die für eine 68 3 Axiomatik der Logistik Ux Uy L Fx Fy x x y (a) (b) Abb. 3.5 (a) Die Menge L ist eine Umgebung des Punkts x. (b) Beispiel für das Trennungsaxiom: zwei Punkte x und ymit ihren Formen Fx und Fy, die durch Umgebungen getrennt werden Definition verteilter Intelligenz und dezentraler Steuerung ausschlaggebend ist (siehe Dezentralität in cyberphysischen Systemen Abschnitt 2.2). Zunächst werden logistische Orte definiert. Der Unterschied zwischen Orten und Plätzenwurde hier vor demHintergrund der existierenden Begriffe Lagerort und Lagerplatz gewählt: Ein Ort ist ein eindeutig identifizierbarer Teil des logistischen Raums, während auf einem Platz physische Objekte getrennt voneinander platziertwerden können. Logistischer Ort Sei O ⊂ L die Menge aller logistischen Orte, so ist jeder dieser Orte o ∈O eindeutig identifizierbar über die Funktion id :O→ IO. Dabei existiert für jeden Ort eine festgelegte, geschlossene Umgebung. Orte können andere Orte beinhalten. Die Umgebungen von Orten können sich wechselseitig überlappen. Ein logistischer Platz hingegen definert sich über seine Beziehung zu den Objekten. Er ist ein Ort, auf dem sich Objekte aufhalten können. Plätze können klassifiziert werden, wenn es einen Bezug zu bestimmten Klassen von Objekten gibt (z. B. Behälterstellplatz, Palettenplatz). Logistischer Platz Sei P die Menge aller logistischen Plätze, so ist jeder dieser Plätze p ∈ P eindeutig identifizierbar über die Funktion id : P→ IP. Dabei gibt es für jeden Platz eine festgelegte, geschlossene Umgebung, die sich nicht mit den Umgebungen anderer Plätze überschneidet. Die Menge von Plätzen bildet mit ihrer geometrischen Anordnung im lo- gistischen Raum die abstrakte Verwaltungsstruktur eines Logistiksystems. Eine häufig vorkommende Anordnung ist das regelmäßige Raster bzw. Git- 3.2 Aufbau der Axiomatik 69 o2 o1 o3 o5 o4 Abb. 3.6 Beispiel eines logistischen Raums mit logistischen Orten. Die schraffierte Fläche kennzeichnet freien Raum, der keinem Ort zugeordnet ist. Abb. 3.7 Schema eines Blockzeilenlagers ternetz, wie es beispielsweise in Regallagern oder Bodenblocklagern (vgl. Abbildung 3.7) zum Einsatz kommt. Logistische Objekte Während sich die Strukturierung des logistischen Raums auf topologischen Konzepten der Mathematik gründet, stammen die Axiome und Prinzipien zum Inhalt des Raums aus der logistischen Praxis. Die im folgenden aufge- stellten Begriffe unterscheiden sich vor allem durch ihren Abstraktionsgrad in Bezug auf die Trennbarkeit und die Identifizierbarkeit einzelner Objekte. Der Begriff mit dem höchsten Abstraktionsgrad ist der des logistischen Ma- terials. Er beschreibt alle unterscheidbaren Klassen von physischem Material, die eine logistische Relevanz innerhalb eines betrachteten Systems besitzen. Das Material unterscheidet sich von der ortsfesten Infrastruktur durch sei- ne Beweglichkeit. Es wird nicht getrennt betrachtet und einzelne Objekte werden nicht gezählt (vgl. Schüttgut). Die Bestimmung der Quantität erfolgt über eine Messung in einer zur Klasse passenden Maßeinheit (z. B. Gewicht in kg). Der Bezug zur Strukturierung wird über eine Verortung hergestellt. 70 3 Axiomatik der Logistik Jede Menge von Material mit einer Quantität ist eindeutig einem logistischen Ort zugeordnet. Logistisches Material Sei M die Menge aller Klassen von physischemMaterial, die eine logis- tisch relevante Bedeutung im Raum L haben. Dann gibt die Funktion content :O→ MO ∈ M die Klassen von physischen Objekten zurück, die sich an einem Ort befinden, und die Funktion quantity : MO→R liefert die jeweilige am Ort befindliche Quantität in einer zur Klasse passenden Maßeinheit. Eine Spezialisierung logistischen Materials sind die logistischen Artikel. Sie repräsentieren einzeln trennbare und damit zählbare physische Objekte (vgl. Stückgut). Alle Objekte einer Artikelklasse weisen die gleichen Eigenschaften auf, sie sind untereinander austauschbar. Objekte innerhalb einer Artikelklas- se unterscheiden sich nicht und sind daher nicht eindeutig identifizierbar. Typischerweise wird eine Artikelklasse über eine Artikelnummer beschrieben, die auch außerhalb des Logistiksystems eine eindeutige Kennzeichnung ist. Artikel bilden die Geschäftsobjekte eines Logistiksystems, und ihre Verwal- tung ist Kernbestandteil seiner Funktionalität. Logistischer Artikel Sei M die Menge aller Klassen von physischen Objekten, die eine logistisch relevante Bedeutung im Raum L haben. Dann sei A ∈ M die Menge an physischen Objekten, die einzeln trennbar und damit zählbar sind und deren Verwaltung und Bewegung zur Hauptaufgabe des Logistiksystems gehören. Artikel sind nicht einzeln identifizierbar, sondern nur klassifizierbar. Während sich die Begriffe des Materials und des Artikels auf Klassen bezie- hen, steht der Begriff des logistischen Objekts für ein eindeutig identifizierbares physisches Objekt im logistischen Raum. Ein logistisches Objekt projiziert das reale Objekt auf eine abstrakte Form, die durch eine eindeutige Position und Rotation seine Belegung im logistischen Raum beschreibt. Aus dem Axiom der Trennung folgt, dass sich keine zwei logistischen Objekte mit ihren Formen überdecken können. 3.2 Aufbau der Axiomatik 71 Logistisches Objekt Sei D ⊂ L die Menge aller logistischen Objekte, so ist jedes dieser Objekte d ∈ D eindeutig identifizierbar über die Funktion id : D→ ID. Für jedes Objekt kann über die Funktion env : D→ L eine Umgebung Ud ∈ L bestimmt werden, die das Objekt im Raum belegt. Über die Funktion f orm : D→ L kann die spezifische Form Fd ∈Ud innerhalb der Umgebung bestimmt werden. Der Definitionsbereich der Funktion besteht aus der Menge aller Punkte in L, sodass die Bildmenge der Form zu jeder Zeit vollständig im logistischen Raum liegt. Das logistische Objekt bildet mit seiner Projektion eine Verkürzung der Wirk- lichkeit ab, die in der Regel mit einer Reduzierung der räumlichen Dimen- sionen einhergeht. Das Axiom des Beinhaltens beschreibt den Erhalt der Infor- mationen über das reale Objekt bei einer solchen räumlichen Verkürzung. Es steht im Gegensatz zum Axiom der Trennung für die Möglichkeit, dass sich mehrere Objekte und Artikel gleichzeitig am selben Ort im logistischen Raum aufhalten können. In dieser Axiomatik bezieht sich der Begriff des Beinhaltens ausschließlich auf Artikel (vgl. Abbildung 3.8a). Damit werden insbesondere Ladehilfsmittel, wie etwa Pakete oder Behälter, abgebildet. Axiom des Beinhaltens Sei d ∈ D ein logistisches Objekt und beschreibe Ad ∈ A die Menge an unterschiedlichen Artikelklassen, die Inhalt des logistischen Objekts d sein können. Dann gibt die Funktion content : D→ Cd ∈ Ad die Menge von tatsächlich enthaltenen Artikelklassen zurück, und die Funktion count : Ad→N liefert die Anzahl an enthaltenen Artikeln. Die Artikel vollziehen als Inhalt jeden Ortswechsel des Objekts nach. Wenn ein logistisches Objekt ein anderes logistisches Objekt enthält, wird dies über das Axiom der Vereinigung abgebildet (vgl. Abbildung 3.8b). Es beschreibt eine hierarchische Beziehung zwischen über- und untergeordneten Objekten. Die Position und Rotation eines untergeordneten Objekts wird nach der Vereinigung relativ zu der des übergeordneten Systems betrachtet. Auf diese Weise werden räumliche Strukturen innerhalb logistischer Objekte abgebildet. 72 3 Axiomatik der Logistik d1 d1 (a3 , 15) d2 (a8 , 10) d3 (a7 , 2) d4 (a) (b) Abb. 3.8 (a) Das logistische Objekt d1 beinhaltet die Artikel a3, a7 und a8. (b) Die logistischen Objekte d2, d3 und d4 sind innerhalb von d1 vereinigt. Axiom der Vereinigung Seien d, e ∈ D logistische Objekte und sei die Form f orm(d) derart, dass sie in die Form f orm(e) passt, dann können d und e derart ver- einigt werden, dass d zum Inhalt von e gehört und im Sinne einer Baumstruktur untergeordnet ist. Die Funktion children : D→ DC ∈ D gibt die Menge der untergeordneten Objekte zurück. Die Funktion parent : D→ D liefert das übergeordnete Objekt zurück. Alle unterge- ordneten Objekte bewegen sich zusammen mit dem übergeordneten Objekt. Der Unterschied zwischen den Begriffen des Beinhaltens und des Vereinigens ist ein Kerngedanke der Axiomatik, der die verschiedenen Grade der Verkür- zung physischer Wirklichkeit abbildet, die inhärent mit der Fähigkeit eines Systems zur Beobachtung der Wirklichkeit verbunden sind. Das Vereinigen erhält die Information über die Identität des untergeordneten Objekts, das weiterhin vom übergeordneten Objekt getrennt betrachtet werden kann, wäh- rend das Beinhalten keine Informationen über Identität, Form oder Position von Einzelobjekten kennt. Durch das Vereinigen lässt sich der Raum auf logistischen Objekten struk- turieren, wie es z. B. bei dem Packmuster einer Palette auftritt (siehe Abbil- dung 3.9). Hier ist es eher eine Frage des Betrachtungsrahmens, ob diese feingliedrige Strukturierung als lohnenswerter Teil des logistischen Raums gesehen werden sollte. Die weitergehende Fragestellung ist hier jedoch, wel- chen Einfluss die erreichbare Genauigkeit und Häufigkeit von Messungen auf dieModellierung haben sollte undwo grundsätzlich die Grenze zwischen der Struktur des Raums und seinen Inhalten gezogen wird. 3.2 Aufbau der Axiomatik 73 Abb. 3.9 Vereinigung von logistischen Objekten: Strukturierung des Raums auf einem logistischen Objekt am Beispiel einer Palette Der Zusammenhang zwischen Ladehilfsmitteln, Plätzen und Orten bei der Modellierung lässt sich gut am Beispiel eines Palettendurchlaufregals ver- anschaulichen. Hierbei handelt es sich im Prinzip um die rein mechanische Realisierung des Modells einer FIFO-Warteschlage. Die Paletten werden auf das eine Ende einer schrägen Rollenbahn aufgesetzt und rollen von der Schwerkraft angetrieben zum anderen Ende hin (siehe Abbildung 3.10). Die gesamte Rollenbahn kann als ein einzelner Platz angesehen werden, auf dem mehrere Paletten gelagert werden. Sowohl die Regalgasse als übergeordne- ter Ort als auch die Übergabestellen als untergeordnete Orte ergänzen das Modell. Die Trennung wird durch die Verwendung von Standardpaletten im Zusammenspiel mit Bremsrollen und einer Durchschubsicherung erreicht. So kann ein von der individuellen Form der zu lagernden Artikel unabhän- giges Modell abstrakt beschrieben werden. Das Bemerkenswerte an dem Beispiel des Palettendurchlaufregals ist, dass es vollkommen ohne Automa- tisierungstechnik bereits die Realisierung eines nicht-trivialen, logistischen Verhaltenmodells darstellt. Abb. 3.10 Palettendurchlaufregal Das Beispiel der Standardpalette illustriert die Bedeutung von standardisier- ten Ladehilfsmitteln für die Strukturierung des Raums. Durch ihren Einsatz werden Größe und Form logistischer Artikel und Objekte aus Sicht des Sys- tems vereinheitlicht. Dies ermöglicht wiederum, die Form und Größe der Plätze zu standardisieren. 74 3 Axiomatik der Logistik Zustandsänderungen Neben der Änderung der Struktur des logistischen Raums sowie der Or- te und Plätze bilden die vier Aktivitäten des Vereinigens/Auflösens und des Hinzufügens/Entnehmens die grundlegenden Formen der inneren Zu- standsänderung von Objekten in dieser Axiomatik. Als weiteres Merkmal dieser Aktivitäten ist festzuhalten, dass sie nur in ihrer lokalen Nachbarschaft auftreten können. Damit soll ausgedrückt werden, dass alle Tätigkeiten, die verkürzt abgebildet dazu führen, dass sich die Zuordnung eines physischen Objekts zu einem logistischen Objekt ändert, nur durch kleinere lokale Be- wegungen und mechanische Veränderungen unmittelbar am logistischen Objekt erfolgen (z. B. Hineinlegen, Aufstellen, Verpacken, Befestigen usw.). Zu diesem Zweck wird eine Nachbarschaft definiert, die das Konzept dieser lokalen, räumlichen Nähe zwischen Objekten beschreibt. Nachbarschaft Für jedes Objekt d können über die Funktion neighbours : D→ Dn ∈ D die Objekte abgefragt werden, die sich in der Nähe von d befinden. Die genaue Bestimmung der Nachbarschaft hängt von den jeweiligen konkreten Objekten und ihren Ausmaßen ab, die abgebildet werden. Die Nachbarschaft eines Objekts bewegt sich immer mit dem Objekt selbst mit, sodass dieses sich im Mittelpunkt der Umgebung befindet. Eine Änderung der Anzahl und Zusammensetzung der Nachbarn ergibt sich durch eine Ortsveränderung entweder des Objekts oder seiner Nachbarn. Das Axiom der lokalen Zustandsänderung soll hier aufgestellt werden, um auszudrücken, dass zwei Objekte sich in räumlicher Nähe befinden müssen, damit sie ihre jeweiligen Zustände untereinander wechseln können. Dabei erhalten intrinsische Zustandsänderungen die Gesamtmenge an logistischen Materialien, die sich im System befinden: Es kommt weder neues Material hinzu, noch geht Material verloren. Als extrinsische Zustandsänderungen gel- ten alle Änderungen, die sich auf die Gesamtmenge und -zusammensetzung von Material im System auswirken. 3.2 Aufbau der Axiomatik 75 d1 d2 (a , 15) (a , 0) Abb. 3.11 Zwei logistische Objekte in ihrer jeweiligen Nachbarschaft (schraffierte Linie) Axiom der lokalen Zustandsänderung Alle Zustandsänderungen eines logistischen Objekts erfolgen in einer lokal begrenzten Umgebung. Seien d, e∈D logistische Objekte, so kann ein Zustandstransfer zwischen diesen Objekten nur stattfinden, wenn gilt: d ∈ neighbours(e) und e ∈ neighbours(d). Auch die Bewegung als systemweite Ortsveränderung eines Objekts erfolgt durch eine Verkettung von lokalen Ortsveränderungen. Aus globaler Systemsicht werden diese lokalen Zustandsänderungen mikroskopisch genannt. Die spezifische Zuordnung eines physischen Objekts zu den logistischen Objekten oder zu den Artikeln ist beim Einsatz dieser Axiomatik in einer praktischen Anwendung eine kritische Modellierungsentscheidung. Wege und Relationen Neben dem einfachen Vorhandensein von Orten, Plätzen und Objekten ist ein Logistiksystem von der Möglichkeit bzw. Notwendigkeit gekennzeichnet, die Objekte zu bewegen. Die Definition eines logistischenWegs orientiert sich an der Definition des Wegs aus der Geometrie und ergänzt diese durch die Berücksichtigung der Umgebung eines Objekts, dessen wirkliche, physische Belegung im logistischen Raum sie darstellt. 76 3 Axiomatik der Logistik Logistischer Weg Sei L ein logistischer Raum und I = [a,b] ein reelles Intervall. Ein logistischer Weg kann über die stetige Funktion f : I → L definiert werden, wenn ein Objekt ∃d ∈ D existiert, so dass für seine Hülle auf der Bahnkurve env( f (I)) ∈ L gilt, also für alle Punkte der Bahnkurve auch die Umgebung von d immer im logistischen Raum liegt. Die Punkte f (a) und f (b) heißen Anfangs- und Endpunkt der Kurve. In Abbildung 3.12a ist eine solche Bahnkurve von Ort a nach Ort b gestrichelt gezeichnet, während die Hülle die Punkte der Kurve im logistischen Raum (gestrichelter Bereich) umfasst, die vom bewegten Objekt belegt werden. Ein Weg ist eine von vielen möglichen Verbindungen zwischen zwei Orten. In einem logistischen System stehen grundsätzlich alle Orte zueinander in Relation, daher gibt es immer mindestens einen logistischen Weg zwischen zwei Orten, sodass der logistische Raum eine einzige Wegzusammenhangs- komponente darstellt. Abbildung 3.12b zeigt die Homotopie zweier Kurven und soll als Veran- schaulichung für die Vielzahl an möglichen Wegen zwischen zwei Orten im freien logistischen Raum dienen. Im späteren Verlauf der Arbeit wird eine solche Homotopiegruppe von Kurven eine tragende Rolle für eine heuris- tische Verbesserung der in dieser Arbeit entwickelten Bewegungsplanung spielen (siehe Kapitel 6). y0(t) y a x H(t,s) b y1(t) (a) (b) Abb. 3.12 (a) Bahnkurve eines logistischen Wegs von a nach b mit ihrer Hülle (b) Homotopie zweier Kurven Betrachtet man zwei logistischeWege von a nach b und von x nach ymit ihren Hüllen, dann sind sie disjunkt, wenn envab( fab(Iab)) ∩ envxy( fxy(Ixy)) = ∅ gilt. Zwei Objekte, die sich auf diesen Kurven bewegen, werden sich nie- mals direkt beeinflussen, insbesondere entstehen keine Kollisionen (siehe Abbildung 3.13a). Kreuzen sich die Wege oder gibt es eine anderweitige Überlappung der Hüllen, dann ensteht eine Konfliktzone K, die von der Schnittmenge der Hüllen K = envab( fab(Iab)) ∩ envxy( fxy(Ixy)) gebildet wird (siehe Abbildung 3.13b). In dieser Zone sind Kollisionen von Objekten möglich, sodass ein logistisches System durch ein geeignetes Steuerungs- 3.2 Aufbau der Axiomatik 77 verfahren die Bewegung der beiden Objekte in Abhängigkeit voneinander kollisionsfrei koordinieren muss. y y x b b a a x (a) (b) Abb. 3.13 (a) Zwei disjunkte logistische Wege (b) Zwei logistische Wege mit Konfliktzone Im Rahmen derModellbildung und späteren Realisierung ist der Unterschied zwischen demWeg als logistischem Konzept der Erreichbarkeit von Orten und der zugehörigen Bahnkurve als Bildmenge von Punkten im logistischen Raum wichtig: Die Existenz eines Wegs von a nach b bedeutet, dass es im logistischen Raum eine Bahnkurve gibt, sodass in der physischen Wirklich- keit ein Objekt von a nach b bewegt werden kann. Wenn die Bildmenge punktgenau bestimmt werden soll, dann kann das entweder über eine Be- obachtung der Wirklichkeit geschehen oder über eine Parameterdarstellung der Kurve berechnet werden. Die Grundaufgabe eines Steuerungsverfahrens ist die Lösung der Aufgabe der Planung einer Bewegung und ihre geregelte, kontrollierte Ausführung in der Wirklichkeit. Wenn der logistische Raum so beschaffen ist, dass zwischen zwei Orten oder Plätzen dauerhaft logistische Wege existieren, über die eine oder meh- rere Klassen von Objekten bewegt werden können, dann stehen diese Orte oder Plätze in Relation zueinander. Hinter dem Konzept der logistischen Relation steht zum einen der Wunsch nach der weitergehenden Abstraktion des Raums hin zu einer Netzwerkdarstellung als Graph mit Knoten und Kanten. Zum anderen ist die Relation auch ein Ausdruck des Bewegungs- potenzials im logistischen Raum, weg von der Betrachtung der Bewegung eines einzelnen Objekts, hin zur Bewegungsmöglichkeit und -koordination vieler Objekte. Logistische Relation Zwei logistische Orte oder Plätze stehen in Relation zueinander, solan- ge es mindestens einen logistischen Weg gibt, der beide verbindet. Die logistische Relation kann gerichtet oder ungerichtet sein und bildet die Grundlage für Definitionen logistischer Netzwerke. 78 3 Axiomatik der Logistik Die logistische Relation ist ein mächtiges Werkzeug zur Verkürzung der Wirklichkeit auf essenzielle logistische Zusammenhänge. In der Netzwerk- darstellung als Graph mit Knoten und Kanten liegt aber auch die Gefahr verborgen, dass der logistische Raum zu sehr vereinfacht wird. Zum einen kann eine Kante als einzelner Weg missverstanden werden, zum anderen werden Graphen oft als Planungswerkzeug benutzt und stellen eine statische Struktur des logistischen Raums dar, die eine freie Nutzung des tatsächlich vorhandenen physischen Raums zugunsten vordefinierter Wege aufgibt. Dynamik und Bewegung Mit den vorangegangenen Definitionen und Überlegungen kann nun ei- ne grundlegende Definition der Logistik erfolgen, indem diese um die Zeit ergänzt werden. Logistik Die Logistik beschreibt die vernünftige Bewegung logistischer Ob- jekte an Orten, durch die Zeit und in Relationen. Zum Beispiel wird die Bewegung eines Objekts von einemOrt a zu einemOrt b innerhalb eines Intervalls T der Zeit auf der Bahnkurve eines logistischen Wegs beschrieben. Die Vernunft der Bewegung könnte zum Beispiel bedeuten, dass der Weg mit der kürzesten Bahnkurve gewählt wird. Es kann aber auch sein, dass eine längere Kurve gewählt wird, deren Weg weniger Konfliktzo- nen enthält und die somit in kürzerer Zeit zum Ziel kommt. Somit fällt unter den Begriff der Vernunft auch der Bereich der Prinzipien der klassischen Optimierung (z. B. des Operations Research). Für die Beschreibung der Bewegung reicht für die Logistik ein kinodyna- mischer Ansatz aus, der rein geometrisch zusätzlich zu den Größen Ort und Zeit die Ableitungen Geschwindigkeit, Beschleunigung und Ruck berücksichtigt. Das räumliche Bezugssystem bildet der logistische Raum, während das zeit- liche Bezugssystem von der Lage und Ausdehnung des logistischen Raums in der physischen Wirklichkeit abhängt. Prinzip der Kollisionsfreiheit Die Bewegung aller logistischen Objekte erfolgt kollisionsfrei. Die Um- gebungen zweier Objekte, die nicht vereinigt sind und sich nicht be- inhalten, werden sich zu keinem Zeitpunkt überdecken. Aus dem Trennungsaxiom unter Hinzunahme der Zeit folgt, dass sich zwei Objekte nicht zur gleichen Zeit am gleichen Ort befinden können. Die Ge- schwindigkeiten zweier Objekte auf sich kreuzenden Bahnkurven ist stets so angepasst, dass keine Kollision entsteht. 3.2 Aufbau der Axiomatik 79 Logistische Prozesse Ein weiteres Kennzeichen eines logistischen Systems sind wiederkehrende Bewegungsvorgänge entlang definierter Relationen. Dies folgt aus der end- lichen Anzahl von Orten und Plätzen, die durch eine endliche Anzahl von Relationen verbunden sind. Über die Zeit werden die Bewegungen unter- schiedlicher Objekte für eine Relation entlang logistischerWege durchgeführt, die sich gleichen oder sehr ähnlich sind. Axiom der wiederkehrenden Bewegungsvorgänge Logistik ist gekennzeichnet von wiederkehrenden Bewegungsvorgän- gen im logistischen Raum. Die Planung von wiederkehrenden Be- wegungsvorgängen ermöglicht bzw. erfordert die Betrachtung des Bewegungspotenzials eines Systems und die Untersuchung der Mög- lichkeit paralleler Bewegungsvorgänge über alle möglichen Wege aller Relationen unter Berücksichtigung der Kollisionsfreiheit. Über wiederkehrende Bewegungsvorgänge ließe sich eine Art von Fluss- begriff für den logistischen Raum definieren. Jedoch stehen hier die schon existierenden Begriffe etwas imWege. Auf der einen Seite ist derMaterialfluss als Begriff zu breit und abstrakt gefasst, da er im Grunde als Verkettung sämt- licher Zustandsänderungen eines physischen Objekts definiert ist. Auf der anderen Seite ist der physikalische Flussbegriff eher als Durchsatzdefinition von Teilchen durch eine beobachtete Fläche zu sehen. Mit der Grundidee eines Flusses ergibt sich jedoch die Vorstellung von spe- zifischen Orten, an denen dieser Fluss entsteht und wo er versiegt. Was für die Bewegung einzelner Objekte der Startort und der Zielort sind, bilden für wiederholte Bewegungsvorgänge die Quellen und die Senken ab. Die grundle- gende Ursache für die Festlegung besonderer Orte ist, dass in vielen realen Systemen spezifische Zustandsänderungen nicht überall stattfinden können. Welche Zustandsänderungen wo stattfinden können, ist anwendungsspezi- fisch. Zu den besonderen Orten zählen z. B. der Wareneingang und -ausgang in Lagerhäusern oder auch Kommissionierplätze. Im Allgemeinen wird in dieser Axiomatik von der Existenz besonderer Orte und Plätze ausgegan- gen, die als Quellen und Senken von wiederholten Bewegungsvorgängen angenommen werden. 80 3 Axiomatik der Logistik Axiom der besonderen Orte und Plätze Der logistische Raum enthält besondere Orte und Plätze, die jeweils einer Klasse zugeordnet sind. Für jede Klasse sind Zustandsänderun- gen definiert, die an diesen Orten durchgeführt werden können. Die besonderen Orte bilden Startorte und Zielorte von Relationen. Beson- dere Plätze sind Start und Ziel individueller Bewegungsvorgänge von logistischen Objekten. Zu dem Begriff der Vernunft der Bewegung im logistischen Raum gehört einerseits die Vermeidung unnötiger Bewegungen, andererseits auch die gezielte Bewegung zu besonderen Orten und Plätzen mit dem Zweck der Zu- standsänderung. Die extrinsischeMotivation für diese gezielten Bewegungen findet sich in anwendungsspezifischen Prozessen, für deren Bearbeitung be- stimmte Zustandsänderungen erforderlich sind. Für diese Axiomatik ist eine formale Definition des Prozessbegriffs nicht notwendigerweise zielführend, da sie in Konkurrenz zu anderen Definitionen stehen würde und für den eigentlichen Fokus der Betrachtung der Bewegungsplanung nicht benötigt wird. Gezielte Bewegungen zu besonderen Orten führen zusammen mit der Kollisionsfreiheit zu einer natürlichen Reihenfolgebildung der Objekte im logistischen Raum. Diese natürliche Reihenfolge führt zu einer Sequenzie- rung der Bewegungsvorgänge, die sich direkt auf die Struktur der Objekte im Raum auswirkt. Wenn eine spezifische Strukturierung der Objekte erwünscht ist, dann erfordert dies eine gezielte Reihenfolgebildung. Reihenfolgebildung Kollisionsfreihe Bewegungsvorgänge durch besondere Orte führen zu einer natürlichen Reihenfolgebildung der Objekte im logistischen Raum. Zusätzlich kann eine gezielte Reihenfolgebildung für die Organisation der Objekte im Raum definiert werden, die zusätzlich zu den sonstigen Bedingungen für die Bewegungsplanung berücksichtigt werden muss. Durch die Reihenfolgebildung werden logistische Objekte und ihre Bewe- gungsvorgänge voneinander abhängig. Es entsteht eine Vorher-Nachher- Beziehung, die als partielle Ordnung dargestellt werden kann. Diese raum- zeitliche Abhängigkeit in der Reihenfolge kann dazu führen, dass ein Be- wegungsvorgang verändert oder sogar pausiert wird, zum einen, damit Kollisionen vermieden werden, und zum anderen, damit eine mögliche vor- gegebene Reihenfolge eingehalten wird. In beiden Fällen können Warteschlangen entstehen, die entweder klas- sisch als tatsächliche räumliche Schlangenstruktur gebildet werden (siehe 3.2 Aufbau der Axiomatik 81 Abbildung 3.14a) oder als verteilte Warteschlange im Raum gebildet werden (siehe Abbildung 3.14b). Warteschlange Eine Warteschlange bildet sich aus einer Menge von logistischen Ob- jekten, die durch eine Vorher-Nachher-Beziehung so lange in Abhän- gigkeit stehen, bis sie sich durch einen bestimmten Ort bewegt haben. Sowohl die Objekte als auch der Ort können während des Wartens stillstehen oder in Bewegung sein. Warteschlangen können auch durch Engstellen im logistischen Raum auf natürliche Weise entstehen, wobei die Objekte einzig durch die gemeinsame Passage der Engstelle in Abhängigkeit geraten. 1 2 3 2 1 0 0 3 (a) (b) Abb. 3.14 (a) Klassische Warteschlange (b) Verteilte Warteschlange Im Gegensatz zur klassischen Warteschlangentheorie wird in diesem Axio- mensystem die Warteschlange nicht als abstrakte Struktur ohne räumliche Ausdehnung betrachtet, sondern als eine raumzeitliche Abhängigkeit von logistischen Objekten, die Platz im logistischen Raum belegen (vgl. [Bau13]). Idealisiertes Förder- und Lagerwesen Aus dem Prinzip der Kollisionsfreiheit verbunden mit der Endlichkeit des logistischen Raums folgt die begrenzte Kapazität eines logistischen Systems. Diese Kapazität ist im Ruhezustand aller Objekte gleich der maximalen Anzahl an Plätzen, die ohne Überlappung im logistischen Raum angeordnet werden können. Abbildung 3.15a zeigt das idealisierte Lagerwesen in Form einer gitterbasierten Anordnung von rechteckigen Dingen mit sehr guter Raumausnutzung, sodass eine Bewegung der Objekte nur im festgelegten Raster stattfinden kann (Pfeil in der Abbildung). Abbildung 3.15b zeigt das idealisierte Förderwesen in Form der gleichzeitigen kollisionsfreien Bewegung aller Objekte im freien Raum. Während die Ka- pazität eines logistischen Systems mit vollständig ruhenden Dingen trivial zu bestimmen ist, führt die Bewegung von Objekten zur Notwendigkeit von freiem Raum zum Manövrieren, der die allgemein verfügbare Kapazität 82 3 Axiomatik der Logistik (a) (b) Abb. 3.15 (a) Kollisionsfreiheit bei gitterbasierter Trennung im Ruhezustand (idealisiertes Lagerwesen) (b) Gleichzeitige kollisionsfreie Bewegung aller Objekte (idealisiertes Förderwesen) verringert. Die genaue Bestimmung des zur Bewegung notwendigen freien Raums ist von einer Vielzahl von Faktoren abhängig: von kinodynamischen Zwangsbedingungen bei der Ausführung der Bewegung, der Gestaltung des logistischen Raums, der Bewegungsplanung. In der Regel werden logistische Systeme so gebaut, dass es dezidierte Lagerbereiche gibt, die durch Förderbereiche oder -strecken miteinander verbunden sind. Ein Beispiel für die Kombination aus Lager- und Förder- bereichen ist in Abbildung 3.7 mit dem Blockzeilenlager gegeben, mit den Blöcken als Lagerbereiche und dazwischenliegenden Förderwegen als Zei- lentrennung. Im Sinne dieser Axiomatik bilden diese Bereiche als Karten dann in ihrer Gesamtheit den Atlas des logistischen Raums. 3.3 Zur Beobachtung in logistischen Systemen Mit der bislang beschriebenen Axiomatik wird der Zustand des Logistik- systems im Sinne eines allwissenden, globalen und zeitunabhängigen Beob- achters beschrieben. Die Abstraktionen der Axiomatik bringen durch ihre verkürzte Abbildung der Wirklichkeit die eingeschränkte Fähigkeit zur Er- kennung und Identifikation von Objekten zum Ausdruck. Zusätzlich ist in der Regel keine zeitlich und räumlich durchgängige Abdeckung für die Be- obachtung des physischen Raums gegeben. Es werden in unregelmäßigen Zeitabständen lokal Ereignisse erzeugt, die einen lokal beschränkten Zustand zu einem bestimmten Zeitpunkt wiedergeben. Ein Großteil der physischen Wirklichkeit des logistischen Systems liegt für einen globalen Beobachter zu jeder Zeit im Verborgenen. Eine Änderung der Zustände im logistischen System kann nur durch diese prinzipiell lokal beschränkten Beobachtungsereignisse erfasst werden, deren zeitverzögerte Aggregation ein globales Abbild des Systems ergeben. Die 3.3 Zur Beobachtung in logistischen Systemen 83 resultierende eingefrorene Systemsicht – der Schnappschuss – repräsentiert damit immer einen in der Vergangenheit liegenden, statischen Systemzu- stand. Die Beobachtungen sind daher natürlicherweise nach den Orten struk- turiert, an denen sie entstehen und wo sie aufgenommen werden. Diese Struktur kann insofern als hierarchisch angenommen werden, als die Ag- gregation von Daten für einen Ort die Information aller Orte beinhaltet, die innerhalb seiner Umgebung liegen. Logistische Ordnung Logistische Ordnung beschreibt den Grad der Fähigkeit eines Sys- tems, zu einem bestimmten Zeitpunkt die Information bereitstellen zu können, die auf die einzelnen Zustände der im logistischen Raum verteilten Objekte schließen lässt. So gilt ein Lager, das nach dem Prinzip der chaotischen Lagerung arbei- tet, so lange als logistisch geordnet, wie eine Datenbank mit der aktuellen Information über die Zuordnung aller Artikel zu ihren Lagerplätzen existiert. Logistische Entropie In gewisser Hinsicht lässt sich die Situation in logistischen Systemen mit Systemen der statistischen Physik vergleichen. In beiden Fällen gibt es eine makroskopische und eine mikroskopische Sichtweise auf die Objekte (oder Teilchen) des Systems und eine Grundproblematik bei der Fähigkeit zur Beobachtung. Aufgrund der lücken- und fehlerhaften Beobachtungsfähig- keit kann auch im logistischen System von einer spontanen Änderung der Mikrozustände ausgegangen werden, sodass sich jedes geordnete logistische System zu einem Zustand der Unordnung hin entwickelt. Axiom der spontanen Zustandsänderung Der makroskopische Zustand eines logistischen Systems setzt sich durch die mikroskopischen Zustände des logistisch relevanten Materi- als im logistischen Raum zusammen. Die mikroskopischen Zustände können sich aus Sicht eines globalen Beobachters jederzeit spontan ändern. Spontane Zustandsänderungen enstehen zum einen durch Messungenau- igkeiten und -fehler bei der Erkennung, Klassifikation oder Identifikation von physischen Objekten. Zum anderen entstehen sie durch ungeplante und unbeobachtete Bewegungen von physischen Objekten (Herunterfallen, Steuerungsfehler, Kommunikationsfehler, menschlicher Irrtum, mechanische Ausfälle, Diebstahl, Unfälle usw.). 84 3 Axiomatik der Logistik Um den makroskopischen Zustand zu aktualisieren, wird eine gewisse Menge an zusätzlicher Information benötigt, damit von diesem wieder auf die tatsächlich vorliegenden Mikrozustände geschlossen werden kann. Spezielle logistische Entropie Die eingeschränkte logistische Entropie ist das Maß für die Unkennt- nis von Position, Geschwindigkeitsvektor und Inhalt aller einzelnen Objekte im logistischen Raum. Bezogen auf das hier entwickelte Axiomensystem bezieht sich die einge- schränkte logistische Entropie in ihrer Zustandsdefinitinon nur auf die im- manenten Eigenschaften aller logistischen Objekte: Position oder Standort sowie Inhalt. Es ist möglich, die Entropiedefinition um weitere Eigenschaften zu erweitern, wenn dies für ein konkretes logistisches System notwendig erscheint. Allgemeine logistische Entropie Die logistische Entropie ist das Maß für die Unkenntnis der Zustände aller einzelnen Objekte im logistischen Raum. Die logistische Entropie ist im Gegensatz zum klassischen thermodynami- schen Entropiebegriff kein objektives physikalisches Maß. Vielmehr hängt sie von der Modelldefinition der Zustandsbeschreibung eines konkreten Systems ab: Wenn das Modell die Temperatur als Zustandsgröße beinhaltet (z. B. in der Impfstofflogistik), dann muss diese Information durch Tempe- ratursensoren erfasst und übermittelt werden. Wenn die Temperatur keine Rolle spielt (z. B. in der Stahlträgerlogistik), dann spielt auch das Fehlen der Temperaturinformation für die Bewertung der logistischen Entropie dieses Systems keine Rolle. 3.4 Konzeption eines Cyberphysischen Zwillings Das Konzept des Cyberphysischen Zwillings ist eine Spezialisierung des Digitalen Zwillings und erweitert diesen um einige für die Logistik wichtige Eigenschaften. Das Konzept ergänzt die Axiomatik der Logistik im Kontext dieser Arbeit um ein allgemeinesModell von dezentralisierbaren Abbildungs- und Steuerungssystemen für die Ausführung von logistischen Bewegungen. Diskretisierung als Grundlage für eine Dezentralisierung der Steuerung Die Diskretisierung von Objekten im logistischen Raum ermöglicht erst den Einsatz einer Bewegungssteuerung. Die natürliche Verteilung von physischen Objekten im Raum führt zu einer verteilten Zustandsinformation, sodass 3.4 Konzeption eines Cyberphysischen Zwillings 85 eine vollkommen dezentrale Betrachtung der Steuerung der grundlegende Basisfall ist, von dem jedes Steuerungssystem abgeleitet werden muss. Es gibt vier Diskretisierungsarten für Objekte in der Logistik: • Physische Diskretisierung Dies können natürlich diskretisierte Artikel sein (z. B. Stahlträger) oder eine Diskretisierung durch Ladehilfsmittel. Die Bauform einiger Ladehilfsmittel ermöglicht eine einfache mecha- nische Vereinzelung. Eine physische Diskretisierung des Raums kann durch bauliche Maßnahmen wie Regale oder auch Farbmarkierungen auf dem Boden geschehen. • Wahrnehmende Diskretisierung Die technische Fähigkeit, physische Objekte oder Räume voneinander trennen zu können, wird hier als wahr- nehmende Diskretisierung betrachtet. In der Regel führt eine solche Diskretisierung zu einer relativen Lokalisierung der Objekte oder Räume untereinander. • Elektronisch-kommunikative DiskretisierungWenn ein Computersys- tem mit Kommunikationsfähigkeit in ein physisches Objekt eingebettet wird, dann kann durch die eindeutige Kennung (z. B. MAC- oder IP- Adresse) bei der Kommunikation eine Diskretisierung von Objekten durchgeführt werden, die gleichzeitig zu einer Identifikation führt. • Algorithmische Diskretisierung Datenstrukturen und Algorithmen in existierender Software, die sich auf physische Objekte oder den logis- tischen Raum beziehen, bestimmen die Diskretisierung während des digitalen Abbildungsprozesses. Damit physische Objekte im Sinne eines Digitalen Schattens automatisiert digital abgebildet werden können, muss ein automatisiertes Identifikations- verfahren existieren, das Objekte einzeln betrachten kann. Abb. 3.16 Cyberphysischer Zwilling 86 3 Axiomatik der Logistik Eigenschaften Diese neue Klasse von Digitalen Zwillingen soll hier als Cyberphysischer Zwilling definiert werden, der folgende zusätzliche Eigenschaften besitzt: • Das digitale Objekt ist wichtiger als das physische Objekt, sodass alle we- sentlichen Änderungen am Verhalten am digitalen Objekt vorgenommen werden und das physische Objekt sein inneres Verhalten entsprechend den Vorgaben des digitalen Objekts laufend anpasst. • Der Übertragungsweg vom digitalen Objekt zum physischen Objekt ist dominant und kann durch die Übertragung kompilierten Quellcodes oder kompilierter neuronaler Netze das Verhalten des abgebildeten cy- berphysischen Systems in der physischen Welt grundlegend ändern. Der Übertragungsweg von der digitalen in die physische Welt ist somit mehr als ein einfacher Datenstrom. • Das physische Objekt ist in der Hauptsache ein Stellvertreter des digita- len Abbilds, agiert aber weitgehend autonom mit einer lokalen Entschei- dungsfindung. • Das physische Objekt kann Datenverarbeitungsprozesse im virtuellen Abbild anstoßen, wenn sich Situationen in der physischen Welt ergeben, die eine Anpassung des Verhaltens notwendig erscheinen lassen. • Alle Cyberphysischen Zwillinge sind in der physischen und der virtu- ellen Welt vernetzt und bilden ein komplexes Gesamtsystem, dessen Verhalten aus beiden Welten heraus gesteuert wird. • Cyberphysische Zwillinge sind bezüglich ihrer logistischen Funktionen und Attribute als mobile, physische Objekte standardisiert. In Abbildung 3.16 wird wieder auf das Grundkonzept eines Systems von Avataren und Agenten Bezug genommen. Es stellt verschiedene Typen Cy- berphysischer Zwillinge in einer Silicon Economy dar, die jeweils in der physischen und der virtuellen Welt als Agenten untereinander verhandeln, aber zwischen den Welten über die exklusive Avatar-Verbindung kommuni- zieren. Die Exklusivität bei dieser Weltensprung-Kommunikation sichert die Synchronizität der beiden Objektkerne und somit die Zwillingseigenschaft ab. Abbildung 3.17 zeigt zusammenhängende Systeme von verteilten Cyber- physischen Zwillingen. 3.4 Konzeption eines Cyberphysischen Zwillings 87 Abb. 3.17 Systeme von verteilten Cyberphysischen Zwillingen Kapitel 4 Anforderungen, existierende Arbeiten und Forschungslücke Zusammenfassung Das vierte Kapitel formuliert zunächst die Anforderun- gen an eine kontinuierliche kinodynamische Bewegungssteuerung logisti- scher Objekte. Diese Anforderungen dienen als Grundlage für eine Analyse der existierenden Verfahren in der Logistik und der Robotik. Die bestehen- den Arbeiten aus der Logistik befassen sich mit der anwendungsbezogenen Bewegungsplanung in innerbetrieblichen Logistiksystemen. Die relevanten Arbeiten der Robotik werden über eine Auswahl an spezifischen Schlüs- selwörtern bestimmt, die zu den Anforderungen passen. Dies ermöglicht, auch die Arbeiten mit in die Betrachtung einzubeziehen, die keinen logisti- schen Anwendungsfall untersuchen. Anschließend werden die Grenzen der existierenden Verfahren analysiert und die Forschungslücke bestimmt. 89 90 4 Anforderungen, existierende Arbeiten und Forschungslücke 4.1 Anforderungen Die Anforderungen an eine kontinuierliche kinodynamische Bewegungs- steuerung logistischer Objekte unter Berücksichtigung dezentraler Ausfüh- rung dienen als Grundlage für einen Abgleich mit Forschungsarbeiten im Betrachtungsraum dieser Arbeit. Mithilfe einer Anforderungsspezifikation werden die Grenzen bisheriger Arbeiten strukturiert erfassbar und die For- schungslücke sowie ihre Implikationen für die Entwicklung eines neuartigen Verfahrens bestimmbar. Stand der Forschung Axiomatik Anforderungs- Logistik Forschungslücke der Logistik spezifikation und ihre Robotik Implikationen Grenzen bisheriger Forschungsarbeiten Abb. 4.1Weiteres Vorgehen zur Bestimmung der Forschungslücke Die Defizite des aktuellen Forschungsstands vor dem Hintergrund der spezi- fizierten Anforderungen offenbaren Anknüpfungspunkte für den Lösungs- entwurf, den diese Arbeit leistet, siehe Abbildung 4.1. Die Anforderungen an ein Verfahren werden wie folgt spezifiziert: • Bewegungsplanung für viele Objekte Das Verfahren muss in der Lage sein, die Bewegung für eine große Zahl an Objekten zu planen. • Echtzeitfähige Planung für neue Objekte Bevor ein neues Objekt in den logistischen Raum eintritt, sollte eine Bewegungsplanung innerhalb eines vorgegebenen Zeitfensters abgeschlossen werden, sodass der physische Bewegungsvorgang nicht durch die Zeit zur Planung verzögert wird. • Berücksichtigung kinodynamischer Zwangsbedingungen Geschwin- digkeit, Beschleunigung und Ruck müssen bei der Bewegungsplanung berücksichtigt werden, sodass ein sicherer Transportvorgang gewährleis- tet ist. • Konfliktfreiheit inklusive Deadlockfreiheit Konflikte zwischen den Be- wegungen verschiedener Objekte müssen vermieden werden. Das Ver- fahren darf keine Deadlocks zulassen. • Hohe Geschwindigkeiten und Beschleunigungen Das Verfahren muss hohe Geschwindigkeiten und Beschleunigungen der bewegten Objekte zulassen. Als hoch werden Geschwindigkeitswerte ab 6m/s und Be- schleunigungswerte ab 3m/s2 angenommen. • Unterstützung für Verfahren der quasi-kontinuierlichen Wahrneh- mung Das Verfahren zur Bewegungssteuerung sollte in der Lage sein, 4.2 Existierende Arbeiten 91 Daten zu Position und Rotation eines Objekts in sehr kurzen Zeitabstän- den zu verarbeiten. • Dezentralisierbarkeit Das Verfahren zur Bewegungssteuerung sollte dezentral ausgeführt werden können. • Vergleichbarkeit mit der analytischen Wegzeitberechnung der Logis- tik Damit ein Vergleich zur klassischen, analytischen Wegzeitberechnung möglich wird, sollte diese als Spezialfall des zu entwickelnden Verfahrens abgebildet werden können. Der Stand der Forschung setzt sich aus bisherigen Arbeiten zur Bewegungs- steuerung in Logistik und Robotik zusammen. Ihnen widmen sich die nach- folgenden Abschnitte. 4.2 Existierende Arbeiten Die existierenden Arbeiten werden getrennt nach den Themenbereichen der Logistik und der Robotik betrachtet. 4.2.1 Logistik Die für diese Arbeit relevanten existierenden Arbeiten stammen aus dem Bereich der technischen Logistik und befassen sich mit der Bewegungspla- nung in innerbetrieblichen Logistiksystemen. Allen Arbeiten ist gemein, dass sie nicht alleine ein Verfahren theoretisch entwickeln, sondern zusätzlich immer einen Bezug auf ein konkretes technisches System aufweisen und häufig parallel zu diesem entwickelt wurden. Kennzeichnend für die Ent- wicklung der Logistikforschung ist der Aufbau von kleinen Demonstratoren in Kombination mit einer Simulation größerer Systeme. Gitterbasierte Systeme Einen guten Überblick über den aktuellen Stand der Forschung und der Industrie im Bereich der gitterbasierten Steuerungsverfahren insbesondere in der (überwiegend) deutschen Logistikforschung- und Industrie findet sich in [Sei16]. Seibold beschreibt die Arbeiten, die auf der Entwicklung des Flex- Conveyors aufbauen, eines modularen, gitterbasierten Stetigfördersystems, das Behälter mithilfe quadratischer Transfermodule in alle vier Richtungen transportieren kann. Dieses System kann durch sogenannte Deadlock-Tokens bestimmte Konfliktsituationen vermeiden, die durch zirkuläre Wartebezie- hungen ausgelöst werden. Es werden weitere gitterbasierte Systeme beschrie- ben: der GridSorter für Sortiersysteme [Fle21], der GridStore als Lagersystem [Gue+14] sowie GridPick als Kommisioniersystem [Ulu14]. Seibold entwickelt in ihrer Arbeit einen Algorithmus, der das Routing auf Basis von logischer Zeit durchführt. Dies ermöglicht eine Reduktion kinody- namischer Bewegungsmodelle auf die ereignisdiskrete Wahrnehmungsfä- 92 4 Anforderungen, existierende Arbeiten und Forschungslücke higkeit des Systems. Folglich wird das Steuerungssystem unabhängig von den tatsächlichen Transportzeiten der einzelnen Transfermodule. Durch die Verwendung von logischer Zeit ergibt sich ein natürlicher Weg zur Dezentra- lisierung der Steuerung, da die ursprüngliche Veröffentlichung von Lamport die Synchronisation verteilter Systeme thematisiert. Das System GridFlow vewendet Transportfahrzeuge, die in einem dich- ten, gitterbasierten Bodenblocklager Paletten transportieren können. Dazu stehen die Paletten auf unterfahrbaren Gestellen, sodass die Fahrzeuge sich unabhängig von den Paletten gitterbasiert bewegen können. Das System vermeidet Deadlocks und Livelocks auf Basis einer globalen Priorisierung der Fahrzeuge (vgl. [SF20]). Das Amazon Kiva System ist ein weiteres gitterbasiertes Transportsystem mit Transportrobotern (vgl. [WDM08]). Es kombiniert ein Lagersystem auf Basis von beweglichen Regalen mit dem Transport der Regale zu Kommissio- nierstationen. Der Steuerungsalgorithmus wurde wissenschaftlich publiziert und führte zu einer Viezahl von weiteren Publikationen in den folgenden Jahren. Insbesondere die formalen Definitionen vonMulti-Agent Pathfinding (MAPF) undMulti-Agent Pickup and Delivery (MAPD) lassen sich auf dieses System zurückführen (vgl. [SS20]). Dabei wurde mit Conflict-based Search (CBS) ein optimaler Algorithmus für die Bewegungsplanung in dieser Sys- temklasse gefunden (vgl. [Sha+15]). Dieser Algorithmus benötigt dabei alle Transportaufträge als Eingabe und berechnet ein optimales Scheduling der Bewegungen der Transportroboter. Eine laufende Eingabe neuer Aufträge ist nicht vorgesehen, und es werden keine kinodynamischen Zwangsbedingun- gen bei der Bewegungsplanung berücksichtigt. Wie bei allen gitterbasierten Systemen muss der Roboter vor einer Richtungsänderung im Stillstand sein. Eine vollkommen dezentrale Steuerung ist möglich, sie bringt für die Vor- ausberechnung aller Bewegungen keinen direkten Mehrwert, da keine lokale Entscheidungsfindung durchgeführt wird. Das System basiert auf einer Lo- kalisierung durch eine Matrix von Barcodes, die auf dem Boden angebracht werden und die von den Robotern zur Lokalisierung gelesen werden. In den folgenden Jahren entstand eine Reihe von ähnlichen Systemen anderer Anbieter (vgl. [Wur17]). Allen gitterbasierten Systemen ist gemein, dass sie eine dichte, infrastruk- turbasierte Struktur abbilden, bei denen der Vermeidung von Deadlocks besondere Bedeutung bei der Bewegungsplanung zukommt. Die Wahrneh- mung beschränkt sich auf ein ereignisdiskretes Informationsmodell, das den Eingang und Ausgang eines Förderguts oder Transportroboters in Bezug auf eine Gitterzelle abbildet. 4.2 Existierende Arbeiten 93 Verfahren unter Berücksichtigung kinodynamischer Zwangsbedingungen In der Regel werden kinodynamische Zwangsbedingungen in der Bewe- gungsplanung logistischer Systeme nur auf der Ebene der individuellen Auslegung der Maximalgeschwindigkeit eines Systems berücksichtigt. Dies kann z. B. die Fahrkurvenplanung eines Regalbediengerätes sein, bei der ein sanftes Beschleunigen und Bremsen zur Vermeidung von Ruck führt. Eine weitere Gegenmaßnahme aus der logistischen Praxis ist eine geeignete mechanische Ladungssicherung oder ein Ladehilfsmittel zur Vermeidung des Herunterfallens von Gegenständen (vgl. [tSD18]). Fahrerlose Transportsysteme Die wissenschaftliche Literatur zu klassischen Fahrerlosen Transportsyste- men (FTS) beschreibt Problemstellungen, die auf festgelegten Straßenkarten basieren. Moderne Entwicklungen in diesem Bereich stützen sich auf Ent- wicklungen der Robotik, sodass sich hier die existierenden Arbeiten auf Anwendung existierender Roboter beschränken (vgl. [DVD20]). Im Kontext dieser Arbeit wird ein FTS als Roboter in einer logistischen Anwendung gesehen. Industrielle Entwicklungen und Systeme Es gibt zahlreiche industrielle Entwicklungen, über die keine detaillierten Veröffentlichungen über die Bewegungsplanung existieren. In vielen Fällen kann aufgrund von Werbematerial (insbesondere Videos) auf bestimmte Ver- fahren geschlossen werden. Dies ist z. B. bei gitterbasierten Verfahren sehr gut zu erkennen. Generell konnte im Rahmen dieser Arbeit kein industri- elles System gefunden werden, welches augenscheinlich den spezifizierten Anforderungen, insbesondere einer freien Orientierung der Fahrzeuge bei gleichzeitig hohen Geschwindigkeiten, genügt. 4.2.2 Robotik Die theoretischen Grundlagen der Bewegungsplanung aus der Robotik wur- den in dieser Arbeit bereits ausführlich dargestellt. Die folgenden Arbeiten beziehen sich daher auf die spezifischen Anforderungen, die sich für die Bewegungsplanung im idealen logistischen Raum ergeben. Es gibt einige Besonderheiten bei der Literaturrecherche im Bereich Robo- tik, die sich für diese Arbeit ergeben. Aus Sicht der Robotik ist die Logistik lediglich eins von vielen Anwendungebieten, in denen Roboter zum Einsatz kommen können. Das bedeutet, dass die einfache Suche nach wissenschaft- lichen Veröffentlichungen mit Logistikbezug nicht zu einem umfassenden Bild der relevanten Literatur führt. Viele Veröffentlichungen, die Verfahren der Bewegungsplanung betreffen, werden nicht für eine Logistikanwendung 94 4 Anforderungen, existierende Arbeiten und Forschungslücke entwickelt und so bei einer einfachen Suche mit dem Begriff Logistik nicht gefunden. Eine weitere Problemstellung ist von weitaus grundsätzlicherer Natur: Selbst aus Sicht der klassischen Logistik stellen Roboter nur ein mögliches Gewerk unter vielen dar. So kommen Greifarmrobotor etwa bei der Kommis- sionierung zum Einsatz, und das weite Feld der Transportroboter fällt unter den Bereich der Unstetigfördertechnik oder der FTS. Es gibt bislang keine Veröffentlichung, die sich mit dem allgemeinen Thema einer frei-orientierten Bewegungsplanung für logistische Objekte befasst, die unabhängig von ei- nem konkreten technischen System ist. Es werden daher in den Ergebnissen der Literaturrecherche die Begriffe der Robotik verwendet, die zu den spezifizierten Anforderungen passend sind. Dazu werden im Folgenden die englischsprachigen Begriffe genannt, die zur Auffindung relevanter Veröffentlichungen der Robotik geführt haben: • Multi-Robot Veröffentlichungen, die eine Vielzahl von Robotern betref- fen • Swarm Veröffentlichungen, die sich mit einer Schwarmsteuerung von Robotern befassen • Kinodynamic Veröffentlichungen, die sich mit kinodynamischer Bewe- gungsplanung befassen • Lifelong Planning Veröffentlichungen, die sich mit einer Bewegungspla- nung befassen, die neue Objekte oder Aufträge während der Ausführung berücksichtigen kann Weitere Anforderungen wie Deadlockfreiheit und die erreichten Geschwin- digkeiten, die in der Praxis getestet wurden, lassen sich in der Regel nicht durch den Titel bestimmen, sondern finden sich im Volltext oder sind eine implizite Eigenschaft der untersuchten Methode (wie z. B. bei Conflict-based Search). Es lässt sich feststellen, dass es eine deutlich größere Anzahl von Veröf- fentlichungen in der Robotik als in der technischen Logistik gibt, was auf die deutlich größere Anzahl an Wissenschaftlern zurückzuführen ist, die sich mit Robotik im Allgemeinen befassen. Gitterbasierte Verfahren mit Logistikbezug Eine Ausnahme von der Regel, dass Veröffentlichungen zur Bewegungspla- nung in der Robotik keinen direkten Bezug zur Logistik haben, lässt sich im Fall der gitterbasierten Verfahren feststellen. Aus einer Veröffentlichung über die Entwicklung des Amazon Kiva Systems ist ein eigener Forschungsbereich der Robotik geworden, der auf einer Formalisierung der Problemstellung basiert, die mit MAPD einen eigenen Begriff bekommen hat (vgl. [WDM08])). 4.2 Existierende Arbeiten 95 Dabei handelt es sich bei MAPD im Grunde um eine altbekannte Problem- stellung der Unstetigfördertechnik, die Lastfahrten und Leerfahrten betrifft. Es wurde in der Robotik für diese Art gitterbasierte Systeme einen neue Begrifflichkeit und ein neues Themengebiet geschaffen. Ein Effekt der Formalisierung des Kiva Systems als MAPD ist die Fest- schreibung spezifischer Eigenschaften des praktischen Systems, an denen sich fast alle weiteren Arbeiten als Randbedingungen halten: das gitterba- sierte Bewegungsmodell, der zeitliche Gleichschritt aller Bewegungen in die nächste Gitterzelle, keine Berücksichtigung individueller Geschwindigkeiten und die labyrinthartigen Layouts mit einem Manhattan-Straßenmodell (vgl. [SS20]). Wie bereits oben beschrieben, existiert mit CBS ein effizienter, optimaler Algorithmus für die Lösung von MAPF (vgl. [Sha+15]). Er kombiniert eine A∗-Suche mit dem geschickten Einsatz eines binären Suchbaums, der die Konfliktfälle speichert, in denen zwei Roboter die gleiche Gitterzelle zum gleichen Zeitpunkt belegen wollen. Über diesen Suchbaum werden die Prio- ritätsmöglichkeiten, nach denen ein Roboter auf den anderen warten muss, für jeweils beide Fälle betrachtet. Damit kann eine günstige Zuweisung von Prioritäten erreicht und die Gesamtleistung des Systems optimiert werden. Damit steht er im Gegensatz zum Verfahren mit logischer Zeit aus der Ar- beit von Seibold, das keine Optimalität für das Gesamtsystem garantiert. Die optimale Bewegungsplanung von CBS efordert jedoch die Eingabe aller Transportanfragen vor Start der Bewegungsplanung und kann damit nicht auf neu hinzukommende Anfragen reagieren. Das Verfahren ist besonders für Szenarien geeignet, für die keine neuen Transporte während der Ausfüh- rung des optimalen Bewegungsplans erforderlich sind und die eine dichte Hindernisregion besitzen, die wenig Ausweichmöglichkeiten bietet, sodass die optimale Zuweisung von Prioritäten von Vorteil ist. Schwarmverfahren Verfahren der Bewegungsplanung auf Basis von Schwarmalgorithmen be- trachten den Roboter als holonomisch agierenden Partikel, der einen Ge- schwindigkeitsvektor besitzt, dessen Werte durch verschiedene Regeln lau- fend neu berechnet werden (Feedback Planning). Die Wahrnehmung des einzelnen Roboters ist dabei auf seine lokale Nachbarschaft beschränkt, in der er die Bewegungen anderer Roboter kontinuierlich beobachtet. Die Ge- schwindigkeitsvektoren der Nachbarn werden bei der Neuberechnung des eigenen Vektors so berücksichtigt, dass keine Konflikte auftreten. Die cha- rakteristische Eigenschaft von Schwarmverfahren ist, dass alle Partikel die Regeln kennen, nach denen sie sich Verhalten (Reziprozität). Mit dem Verfah- ren der Reciprocal Velocity Obstacles (RVO) existiert ein heuristisches Verfah- ren, das diesen Umstand zur Bewegunsgplanung verwendet (vgl. [vLM08]). Aufbauend darauf wurden die ORCA Lines als Methode entwickelt und 96 4 Anforderungen, existierende Arbeiten und Forschungslücke nachgewiesen, dass eine konfliktfreie Bewegung beliebig vieler Teilnehmer garantiert werden kann, wenn der Geschwindigkeitsvektor unbeschränkt ist (vgl. [van+11a]). Alle Schwarmverfahren verwenden eine lokal beschränkte Wahrnehmung und antizipieren die Bewegung anderer Teilnehmer nur über einen be- schränkten Zeithorizont. Damit sind sie nicht in der Lage, globale Deadlock- bedingungen zu verhindern. Bei einer Berücksichtigung kinodynamischer Zwangsbedingungen verliert das ORCA-Verfahren seine Garantie auf Kon- fliktfreiheit, da Situationen entstehen können, die eine plötzliche sehr hohe Geschwindigkeitsänderung erfordern. Bei hohen Geschwindigkeiten besteht für jedes Schwarmverfahren die Herausforderung, einen Eintritt in die Zone der unvermeidlichen Kollision zu erkennen und zu verhindern. Kinodynamische Verfahren für einzelne Roboter Die Entwicklung effizienter Verfahren unter Berücksichtigung kinodyna- mischer Zwangsbedingungen gilt selbst für einzelne Roboter bis heute als Herausforderung in der Robotik. Der Grund liegt in der großen Anzahl an zusätzlichen Zuständen, die von einem Verfahren potenziell betrachtet werden müssen. Das Ziel kinodynamischer Verfahren ist, eine zeitoptimale Pfadplanung zu erreichen, die nicht unbedingt den kürzesten Pfad verwen- det, sondern einen, der hohe Geschwindigkeiten ermöglicht. Dazu sollten Pfade vermieden werden, die ungünstige Zwangsbedingungen erzeugen, wie sie z. B. durch rechte Winkel entstehen (siehe Abschnitt 2.4.6). Bei einer entkoppelten Planung wird zuerst ein Pfad generiert, für den im zweiten Schritt ein Geschwindigkeitsprofil gebildet wird. Für die Erzeugung günstiger Pfade kann auf die besonderen Eigenschaften von Splines zurück- gegriffen werden, die es erlauben, Geschwindigkeiten und Beschleunigung langsam ansteigen zu lassen und ruckartige Bewegungen verhindern. Für die Bewegungsplanung einzelner Roboter wurde dies mit Hilfe von Bézierkur- ven fünfter Ordnung erforscht (vgl. [LSB09]). Ein Vorteil von Splines ist, dass Pfade durch wenige Kontrollpunkte und Parameter repräsentiert werden. Mit dem Timed-Elastic-Bands-Verfahren (TEB) können zeitoptimale Pfa- de auch für nicht-holonomische Roboter effizient berechnet werden (vgl. [Roe+12]). Ein TEB wird als Problemstellung einer gewichteten multikriteri- ellen Optimierung abgebildet. Die meisten Kriterien sind lokal, was zu einer spärlichen Systemmatrix führt, für die es effiziente Lösungsansätze auf Basis Methode der kleinsten Quadrate gibt. Kinodynamische Multi-Roboter-Verfahren Die Problemstellung kinodynamischer Multi-Roboter-Verfahren kombiniert die Komplexität beider Einzelproblemstellungen, sodass bislang keine global optimalen Algorithmen existieren. 4.3 Grenzen existierender Verfahren 97 Ein Ansatz der Komplexitätsreduktion basiert auf einer globalen Pla- nung ohne Konfliktbehandlung zur Generierung von Wegpunkten, die an- schließend über eine dynamische lokale Planung angefahren werden. In [Gar19] wird ein solches Verfahren verwendet, um frei-orientierte FTS in einer Fabrikumgebung zu steuern. Die lokale Planungsmethode ist eine Variante von TEB und wurde in der Praxis mit einer beschränkten Wahrneh- mung von 15m x 15m, einem Zeithorizont von 20s und einer translationalen Geschwindigkeit von 1m/s durchgeführt. Damit ist es möglich, dass sich Fahrzeuge lokal ausweichen können, wenn genügend Platz zur Verfügung steht. Eine weitere Arbeit beschäftigt sich mit der Bahnplanung von Drohnen- schwärmen und setzt dazu eine angepasste Variante des Rapidly-Exploring- Random-Tree-Verfahrens (RRT) ein (vgl. [CKV21]). Das Safe-Intervall-Path-Planning-Verfahren (SIPP) reduziert die Komplexi- tät der Konfliktlösung unter Robotern durch die Bestimmung von Raum-Zeit- Intervallen, in denen eine Kollision vermieden werden muss (vgl. [PL11]). Durch die Beschränkung auf diese Konfliktintervalle wird die Anzahl an Operationen, die für eine Konfliktvermeidung durchgeführt werden müssen, effizient reduziert. Allen Arbeiten im Bereich der kinodynamischen Mutli-Roboter-Verfahren ist gemein, dass sie in Praxis und Simulation relativ wenige Roboter betrach- ten (häufig weniger als 10, üblicherweise nicht mehr als 30). Ein Grund liegt in der mit der Anzahl an Robotern ansteigenden Komplexität der notwendi- gen Berechnungen. 4.3 Grenzen existierender Verfahren In den folgenden Unterabschnitten werden die Grenzen der bisherigen Ar- beiten in Robotik und Logistik zusammengefasst und die Forschungslücke bestimmt, die Thema dieser Arbeit ist. In Bezug auf die spezifizierten An- forderungen können die Grenzen der bisherigen Arbeiten in die folgenden Aspekte strukturiert werden. Grenzen gitterbasierter Systeme und Verfahren In den letzten zehn Jahren gab es grundlegende Entwicklungen im Bereich gitterbasierter Systeme (Kiva, FlexConveyor, Flexsorter usw.) mit einer größe- ren Anzahl an wissenschaftlichen Veröffentlichungen. Dabei wird die Bewe- gungsplanung für viele Objekte bzw. Roboter betrachtet und insbesondere der Aspekt der Deadlockfreiheit bei der Konfliktvermeidung thematisiert. Die Grenzen liegen in der gitterbasierten Struktur, die eine grundsätzlich ungünstige Rahmenbedingung für eine kinodynamische Bewegungsplanung darstellt: Bei jeglichen Richtungswechseln muss das Objekt oder der Roboter zum Stillstand kommen. Dies vermindert die Durschnittsgeschwindigkeit. 98 4 Anforderungen, existierende Arbeiten und Forschungslücke Diese grundlegende Begrenzung führt im idealen, leeren logistischen Raum zu unnötigen Leistungsverlusten. Aus axiomatischer Sicht sind gitterbasierte Verfahren immer dann geeignet, wenn es sich um Systeme handelt, die dem idealen Lagerwesen nahestehen, da hier eine gitterbasierte Struktur natürli- cherweise durch standardisierte Logistikobjekte gegeben ist. Für das ideale Förderwesen sind sie grundsätzlich ungeeignet. Grenzen existierender kontinuierlicher Bewegungsplanung in der Logistik Wenn kontinuierliche Bewegungsplanung aus der Robotik in der Logistik eingesetzt wird, dann nur in der konkreten Anwendung eines Unstetigförder- systems in Form von FTS. Die Bewegungsplanung beschränkt sich hier auf das Roboter-Subsystem und es wird nicht der übergreifende Materialfluss geplant. Die Arbeiten beschränken sich auf die klassischen Anwendungsbe- reiche von FTS, wie z. B. in der Produktionsversorgung, und verbessern dort die bekannten Steuerungsmechanismen. Eine Substitution von Stetigförder- systemen im Allgemeinen wird nicht berücksichtigt. Die Berücksichtigung kinodynamischer Zwangsbedingungen findet vor allem durch Vorgabe nied- riger Maximalgeschwindigkeiten statt, die in den typischen Anwendungsbe- reichen von FTS durch die Sicherheit in der Mensch-Maschine-Interaktion zusätzlich vorgegeben ist. Eine Verfahren mit hohen Beschleunigungen und Geschwindigkeiten wurde daher bislang nicht untersucht. Bislang existiert keine allgemeine Theorie der Bewegungsplanung in der Logistik, die ein kontinuierliches Weltmodell berücksichtigt. Ein möglicher Grund dafür ist, dass bislang eine industrietaugliche kontinuierliche Wahrnehmungsfähigkeit nicht existiert, die für eine technische Umsetzung einer kontinuierlichen Be- wegungsplanung notwendig wäre. Grundlegende Konzepte aus der Robotik, wie der Konfigurationsraum, sind bislang der Logistiktheorie nicht bekannt. Die Robotik wird als Wissenschaft für spezielle Transportsysteme gesehen, die mit der allgemeinen Materialflussplanung keine Überschneidungspunkte besitzt. Grenzen von Schwarmverfahren Schwarmverfahren werden durch ihre lokale Wahrnehmung und ihren li- mitierten Zeithorizont begrenzt. Dies ermöglicht zwar eine effiziente lokale Bewegungssteuerung, jedoch verhindert es in der Praxis hohe Geschwindig- keiten bei gleichzeitig enger Trajektorienführung. Der begrenzte Zeithorizont führt zu der theoretischen Möglichkeit für globale Deadlockzustände. Die kinodynamischen Zwangsbedingungen realer Roboter lassen sich nur bei geringen Geschwindigkeiten durch klassische Schwarmverfahren einhalten. 4.4 Forschungslücke 99 Grenzen existierender Multi-Roboter-Verfahren Die Grenzen existierenderMulti-Roboter-Verfahren sind nicht grundlegender Natur, sondern lassen sich durch eine gewisse Ignoranz der Robotikwissen- schaften gegenüber zukünftigen Logistikanwendungen erklären. Die grund- legende Bewegungsplanung für bekannte Umgebungen gilt als weitgehend gelöst, auch wenn kein effizientes allgemeingültiges Planungsverfahren für Multi-Roboter-Systeme mit kinodynamischen Zwangsbedingungen existiert. Eine Ursache der im Vergleich zu gitterbasierten Systemen fehlenden Ver- öffentlichungen liegt vermutlich in der Abwesenheit einer eindrucksvollen Logistikanwendung im kontinuierlichen Raum, deren Problemstellung aus Sicht eines Robotikwissenschaftlers fruchtbar ist. Existierende Veröffentli- chungen nehmen daher Bezug entweder auf Robotersysteme, die im Umfeld einer Universität selbst gebaut werden, oder auf relativ günstige Systeme, die frei am Markt erhältlich sind. Dementsprechend konzentrieren sich aktuelle Verfahren auf Drohnenschwärme oder selbstgebaute Multi-Roboter-Systeme mit wenigen Einheiten. Verfahren für hohe Geschwindigkeiten werden im Kontext autonomer Fahrzeuge im Straßenverkehr betrachtet (hier werden schnelle Modellautos verwendet). Ein weiterer Grund ist das Fehlen existie- render Sensorik für eine kontinuierliche Wahrnehmung in aktuell verfügba- ren Systemen. Die Folge ist, dass kein veröffentlichtes Verfahren existiert, das alle An- forderungen dieser Arbeit in Bezug auf eine große Anzahl von Objekten, die sich mit hoher Geschwindigkeit unter Berücksichtigung kinodynami- scher Zwangsbedingungen deadlockfrei im hindernisfreien Raum bewegen, erfüllt. 4.4 Forschungslücke Die Forschungslücke ergibt sich aus der Erkenntnis, dass für das idealisierte Förderwesen, das durch den idealen (leeren) logistischen Raum repräsentiert wird, kein allgemeines Verfahren zur kinodynamischen Bewegungsplanung existiert. Aus Sicht einer Axiomatik der Logistik würde durch das Schließen dieser Lücke, zusammen mit den gitterbasierten Verfahren für das idealisier- te Lagerwesen, eine prinzipiell vollständige Beschreibung der logistischen Bewegungsplanung entstehen. Eine Implikation für die Verfahrensentwicklung ist, dass die Suche nach einem geeigneten Verfahren insbesondere den Nachweis für die Durchführ- barkeit in einem allgemein gültigen, archetypischen Anwendungsfall des Förderwesens bedeutet, nicht die Suche nach Optimalität im Sinne der Robo- tikwissenschaften. Es gilt, ein Verfahren zu finden, dass durch Verwendung der am einfachs- ten zu verstehenden notwendigen Methoden und Bausteine die Leistung eines klassischen Logistiksystems erreicht oder übertrifft. Wünschenswert 100 4 Anforderungen, existierende Arbeiten und Forschungslücke wäre zudem eine gute Vergleichbarkeit oder Herleitungsfähigkeit aus der analytischen Wegzeitberechnung der Materialflussplanung als Anküpfungs- punkt und Grundlage zur Entwicklung einer erweiterten Logistiktheorie. Kapitel 5 Verfahren zur kinodynamischen Bewegungsplanung Zusammenfassung Das fünfte Kapitel erarbeitet den Lösungsentwurf dieser Arbeit, ein Verfahren zur kontinuierlichen, kinodynamischen Bewegungs- steuerung logistischer Objekte in der innerbetrieblichen Logistik. Zunächst wird die Gestaltung des idealen logistischen Raums betrachtet und die Pro- blemstellung formal definiert. Dem schließt sich die Beschreibung der Be- standteile und des Verfahrensablaufs an. Dabei werden die Faktoren Durch- führbarkeit, Dezentralisierbarkeit und Echtzeitfähigkeit betrachtet. Im wei- teren Verlauf wird detailliert auf splinebasierte Trajektorien eingegangen und es wird eine geeignete Spline-Familie ausgewählt. Die Abbildung der kinodynamischen Eigenschaften der Bewegungsplanung erfolgt durch ein numerisches Geschwindigkeitprofil, dessen Struktur die Basis für die Bestim- mung der Geschwindigkeiten auf der Trajektorie ist. Dieses Vorgehen bildet die Grundlage für die Erweiterung des Verfahrens auf eine kollisionsfreie Bewegungsplanung für mehrere Objekte. 101 102 5 Verfahren zur kinodynamischen Bewegungsplanung 5.1 Gestaltung des idealen logistischen Raums Die weitere Struktur dieser Arbeit ist auf die Bestandteile und den Ablauf des Verfahrens zur Bewegungsplanung im idealen logistischen Raum ausge- richtet. Neben der Beschreibung des Verfahrens wird ein Bewertungsrahmen für die empirische und simulative Evaluation entwickelt. Die folgenden Abschnitte beschreiben den idealen logistischen Raum mit seinen Eigenschaften und die Bestandteile des Verfahrens in einer Übersicht. Dabei wird auf die Erfüllung der Anforderungen aus Abschnitt 4.1 einge- gangen und auf die grundlegenden Methoden in Abschnitt 2.4 verwiesen. Anschließend folgt eine detaillierte Beschreibung der Algorithmen, die das Verfahren umsetzen. Die besonderen Eigenschaften des idealen logistischen Raums sind das Fehlen von statischen Hindernissen, ein kontinuierlicher Konfigurations- raum und eine Notwendigkeit, die Bewegungen von vielen Objekten koordi- nieren zu müssen. Da keinerlei Lagerung stattfindet, kommen neue Objekte nur von außerhalb des Raums hinein und verlassen den Raum nach Ab- schluss der Bewegung wieder. Daraus folgt, dass sich Quellen und Senken von Bewegungsvorgängen ausschließlich an den Rändern des Raums befin- den (siehe Randpunkte in Abschnitt 2.4.3). Abbildung 5.1 zeigt ein Beispiel eines idealen logistischen Raums mit zwei Quellen und zwei Senken. q s‘ q‘ s Abb. 5.1 Bewegung zweier Objekte im idealen logistischen Raum Die formale Problemstellung im idealen logistischen Raum ähnelt der in Un- terabschnitt 2.4.5 beschriebenen Problemstellung für die Bewegungsplanung mehrerer Objekte. Der Unterschied ist, dass es keine statische Hindernis- region O ⊂W gibt, der kontinuierliche Pfad τ : [0,1]→Z f ree als Ergebnis der Planung zusätzlich kinodynamischen Zwangsbedingungen genügen 5.1 Gestaltung des idealen logistischen Raums 103 muss und die Start- und Zielpunkte am Rand des Raums liegen und auf fest definierte Quellen und Senken beschränkt sind. Die Entwicklung eines vollständigen Algorithmus für die Planung im idealen logistischen Raum hat die Herausforderung, dass die Anzahl der Objekte die Dimension des Zustandsraums Z linear wachsen lässt und dass die anspruchsvolle Planung unter kinodynamischen Zwangsbedingungen zusätzlich erforderlich ist (vgl. Unterabschnitt 2.4.6). Schon die Standardpro- blemstellung für kinodynamische Planung ist PSPACE-hart und die Planung für mehrere Objekte hat im besten Fall eine exponentielle Laufzeit. Folg- lich wird das Verfahren in dieser Arbeit als stichprobenbasierter Algorith- mus entwickelt, der nach den Prinzipien der priorisierten und entkoppelten (Trajektorien-)Planung arbeitet (vgl. Abschnitt 2.4.5 und Abschnitt 2.4.6). q s q‘ Abb. 5.2 Last- und Leerfahrt eines Transportroboters im idealen logistischen Raum In Abbildung 5.2 ist die Bewegungsplanung im idealen logistischen Raum unter Nutzung eines Transportroboters skizziert. In diesem Fall handelt es sich zusätzlich um eine MAPF-Problemstellung (vgl. Abschnitt 2.4.2). Die Bewegungsplanung erfolgt nicht mehr für die Objekte, sondern für eine feste Anzahl an Transportrobotern, die dauerhaft im System verbleiben und die Objekte von den Quellen zu den Senken transportieren. Jeder Auftrag besteht prinzipiell aus einer Leerfahrt ohne Objekt zur Quelle (Pickup) und einer Lastfahrt mit Objekt zur Senke (Delivery). Wie in der Abbildung zu sehen ist, wird dieser Ablauf für den idealen logistischen Raum so modifiziert, dass die Roboter in Warteschlangen an den Quellen auf Objekte warten, diese in einer Lastfahrt zur Senke tranportieren (durchgezogene Linie) und an- schließend in einer Leerfahrt zu einer beliebigen Warteschlange weiterfahren (gestrichelte Linie). Die Warteschlangen befinden sich außerhalb des Raums an seinen Rändern. Ihre gemeinsame Kapazität ist mindestens so groß, dass 104 5 Verfahren zur kinodynamischen Bewegungsplanung sich alle Transportroboter gleichzeitig in einer Warteschlage befinden können (Initialzustand, der Raum ist leer). Die Warteschlagen außerhalb des Raums bilden eine sichere Garagenkonfi- guration, wie sie in Abschnitt 2.4.5 beschrieben wird. Ein Transportroboter in der Warteschlange ist von der allgemeinen Bewegungsplanung ausge- nommen, da er weder Konflikte erzeugt noch durch andere Roboter gestört wird. Sobald der vorderste Roboter die Warteschlange verlässt, rücken alle anderen Roboter automatisch auf. Der vorderste Roboter ist der einzige, der die Warteschlange verlassen kann, sobald seine Bewegungsplanung erfolgt ist. Gleichzeitig kann er beliebig lange warten, bevor er losfährt. Sobald ein Roboter losgefahren ist, kann er sicher sein, dass ein Platz in der Ziel- Warteschlange reserviert ist. Mit dieser Gestaltung ist eine Deadlock- und Livelockfreiheit des Verfahrens gesichert. Wie in Abbildung 5.1 und Abbildung 5.2 angedeutet, kann der ideale logistische Raum eine beliebige Form annehmen. Es gelten grundsätzlich alle Eigenschaften für Räume in der kontinuierlichen Bewegungsplanung, wie sie in Unterabschnitt 2.4.3 beschrieben werden. Insbesondere gilt dies für die grundlegenden topologischen Konzepte, die in Abschnitt 2.4.3 beschrieben werden. Der ideale logistische Raum ist pfadzusammenhängend, und durch das Fehlen einer statischen Hindernisregion sind alle Pfade mit gleicher Quelle und Senke homotop. Für die Mehrzahl der praktischen Anwendungen in der Logistik wird intuitiv angenommen, dass der ideale logistische Raum eine größere freie Fläche beinhaltet, auf der sich Objekte oder Roboter frei bewegen und einan- der einfach ausweichen können. Diese Annahme wird in dieser Arbeit nicht formalisiert, da das Verfahren auch für alle Spezialfälle eine durchführbare Bewegung planen kann. Jedoch basieren die heuristischen Teile des Verfah- rens zur Konfliktvermeidung auf dem Vorhandensein einer größeren freien Fläche im Raum. 5.2 Bestandteile und Ablauf des Verfahrens Die Problemstellung der gleichzeitigen Bewegung vieler Objekte wird über den Ansatz der priorisierten Planung, der in Abschnitt 2.4.5 beschrieben wird, gelöst. Allen Objekten wird eine Priorität zugeordnet. Die Bewegungspla- nung wird nach absteigender Priorität für die Objekte einzeln durchgeführt. Für Objekte niedriger Priorität werden die Objekte höherer Priorität als dynamische Hindernisse berücksichtigt. Diese Priorisierung wird in die- sem Verfahren durch eine Datenstruktur abgebildet, die das Verhalten einer FIFO-Warteschlange hat. In Abbildung 5.3 ist das grundsätzliche Verhalten illustriert. Ein Objekt beginnt den Prozess der Bewegungsplanung, wenn es sich an einer Quelle am Rand außerhalb des Raums befindet. Der Prozess der Bewegungsplanung wird am Ende der Warteschlange eingefügt und erhält 5.2 Bestandteile und Ablauf des Verfahrens 105 Informationen über alle bereits geplanten Bewegungen, die sich vor ihm in der Warteschlange befinden. Sobald die individuelle Bewegungsplanung abgeschlossen ist, steht das Ergebnis der Planung nachfolgenden Prozessen solange zur Verfügung, bis das Objekt den Raum an der Senke verlassen hat. q s‘ q‘ s Abb. 5.3 Datenstruktur der Bewegungskoordination Die Planung der individuellen Bewegung eines Objekts folgt dem Prinzip der entkoppelten Planung, wie es für die Trajektorienplanung in Abschnitt 2.4.6 beschrieben ist, und verbindet diesen Ansatz mit dem induktiven Vorgehen der priorisierten Planung für mehrere Objekte. Die formale Darstellung des resultierenden Planungsproblems kann aus einer Kombination der formalen Problemstellungen in Unterabschnitt 2.4.5 und Unterabschnitt 2.4.6 gebildet werden: • ein WeltmodellW ∈R2 des idealen logistischen Raums • ein unbegrenztes Zeitintervall T = [0,∞) • das aktuell betrachtete Objekt Ai • ein Konfigurationsraum C • ein Zustandsraum Z , der als differenzierbare Mannigfaltigkeit definiert ist und der Z = C oder als abgeleiteter Phasenraum von C definiert werden kann • die Zustandstrajektorien z̃1, . . . , z̃i−1 der bereits geplanten Objekte A1, . . . ,Ai−1 • eine zeitabhängige Hindernisregion Zobs(t), die alle Zustände z̃1(t), . . . , z̃i−1(t) enthält, die zum Zeitpunkt t von den bereits geplanten Objekten eingenommen werden 106 5 Verfahren zur kinodynamischen Bewegungsplanung • der zeitabhängige freie Zustandsraum Z f ree(t) = Z\Zobs(t), der alle Zustände eines Zeitpunkts t enthält, die Kollisionen vermeiden und alle kinodynamischen Zwangsbedingungen einhalten • Für jeden Zustand z ∈ Z gibt es einen beschränkten Aktionsraum U(z) ⊆ Rm ∪ {uT} mit m als feste Anzahl an Aktionsvariablen und uT als Terminierungsaktion. Sei U die Vereinigung aller U()z) über alle z ∈ Z . • eine Zustandsübergangsgleichung ż = f (z,u), die für alle z ∈ Z und u ∈U()z) definiert ist • ein Initialzustand zq aus der Menge aller Quellen • ein Zielzustand zs aus der Menge aller Senken Der Algorithmus berechnet eine Aktionstrajektorie ũ : T→U, aus der eine Zustandstrajektorie z̃ gebildet werden kann, bei der z(0) = zs ist, für die ein t > 0 mit u(t) = uT existiert und für die es ein z(t) = zs gibt. Die Ge- schwindigkeitsvektoren werden für z(0) als null angenommen, das Objekt beginnt die Bewegung im Stillstand. Sobald uT ausgeführt wird, bleibt der erreichte Zustand unverändert. Dabei wird angenommen, dass auch die Geschwindigkeitsvektoren in zs null sind, sodass das physische Objekt nach Durchführung der Bewegung in dieser Endposition verbleibt. Der entwickelte Algorithmus orientiert sich an der entkoppelten Trajektori- enplanung aus Abschnitt 2.4.6. Der Hauptunterschied ist die Verwendung einer Menge von homotopen Pfaden, für die gleichzeitig Zustandstrajektori- en berechnet werden, aus denen die schnellste ausgewählt wird. Folgende Verfahrensschritte werden durchgeführt: 1) Verwende einen einfachen Planungsalgorithmus zur Bestimmung eines stückweise linearen Pfades τ : [0,1]→ C mit den Wegpunkten p0, . . . , pn. 2) Transformiere τ durch eine Pfadglättung in einen neuen Pfad τ′, der die differenziellen Zwangsbedingungen besser erfüllt. 3) Erzeuge eine Menge von homotopen geglätteten Pfaden auf Basis von τ′. 4) Berechne für jeden homotopen Pfad τ′i eine Zeitsteuerungsfunktion σi : [0, tF]→ [0,1] für τ′i , so dass τ′i ◦ σi einen zeitparametrisierten Pfad durch C bilden. Dieser Pfad muss den Anforderungen an eine Zu- standstrajektorie z̃i mit z̃i(t) ∈ Z f ree(t) genügen und ż = F(z(t),u(t)) sowie u(t) ∈U(z(t)) für alle Zeitpunkte erfüllen, bis die terminierende Aktion uT zum Endzeitpunkt tiF ausgeführt wird. 5) Wähle den Pfad τ′i aus, dessen Endzeitpunkt t i F am kleinsten ist. 6) Entwerfe eine Regeleinrichtung π :Z →U, die den Verlauf der geplanten Zustandstrajektorie z̃i in der physischen Realität mit möglichst geringem Fehler nachzubilden versucht. 5.2 Bestandteile und Ablauf des Verfahrens 107 Abbildung 5.4 illustriert das Verfahren. Es ist zu beachten, dass die Schritte 1 und 6 Teil des Verfahrens sind, aber nicht Teil des entwickelten Algorithmus. Der Algorithmus akzeptiert als Eingabe eine Wegpunktliste und berechnet in den Schritten 2 bis 5 eine kollisionsfreie, zeitoptimale Trajektorie zur Ausfüh- rung in einer Regeleinrichtung (z. B. in einem Transportroboter). Der Entwurf der Regeleinrichtung ist Bestandteil der empirischen Evaluation, während die Erstellung der Wegpunktliste im Rahmen der simulativen Evaluation betrachtet wird. Durchführbarkeit Die Durchführbarkeit des Verfahrens wird durch die spezifische Gestaltung des idealen logistischen Raums mit seinen sicheren Quellen und Senken und durch Verfahrensschritt 4 garantiert. Die Bestimmung der Zeitsteuerungs- funktion wird durch eine pfadbeschränkte Trajektorienplanung vorgenommen, die in Abschnitt 2.4.6 beschrieben wird und für die es zahlreiche effizien- te Methoden gibt. Der Algorithmus verwendet die sogenannte Bang-Bang- Methode zur zeitoptimalen Bestimmung eines Geschwindigkeitsprofils unter Berücksichtigung der dynamischen Hindernisregion Zobs. Eine detaillierte Betrachtung der garantierten Terminiertheit des Algorithmus findet sich in Abschnitt 5.6. Intuitiv lässt sich die Durchführbarkeit verstehen, wenn man den schlechtesten Fall der Bewegungsplanung betrachtet, bei dem ein Ob- jekt an seiner Quelle auf alle anderen Objekte warten muss, die eine höhere Priorität besitzen. Da diese Objekte garantiert den Raum nach Abschluss des Bewegungsvorgangs an den Senken verlassen, kann die Bewegungsplanung immer durchgeführt werden, nachdem der Raum vollständig leer ist. Heuristisches Verhalten Das Ziel der heuristischen Bestandteile des Verfahrens ist die Steigerung der Leistung in Bezug auf die Anzahl von Quelle-Ziel-Bewegungen über die Zeit. Dazu wird angenommen, dass in Verfahrensschritt 1 ein möglichst kurzer Pfad von Quelle zu Ziel gewählt wird. Die Pfadglättung in Verfahrensschritt 2 vermeidet kinodynamisch ungünstige Trajektorien und unterstützt so die Verwendung von hohen Geschwindigkeiten und Beschleunigungen. Dies führt zu einer geringen Aufenthaltszeit im logistischen Raum und minimiert die Hindernisregion Zobs für nachfolgende Planungsprozesse. In der Folge wer- den für diese Prozesse Trajektorien mit hohen Geschwindigkeiten möglich, sodass sich ein kontinuierlich vorteilhaftes Gesamtverhalten ergibt. Abbildung 5.5 veranschaulicht die in Verfahrensschritt 3 vorgenommene Erzeugung homotoper Pfade im idealen logistischen Raum. Grundlage die- ser Heuristik ist die Überlegung, dass im freien Raum eine Vielzahl von kinodynamisch günstigen Pfaden existieren kann, sodass sich die Wahr- scheinlichkeit erhöht, dass einer dieser Pfade kollisionsfrei bzw. mit wenigen Kollisionen geplant werden kann. Dies minimiert notwendige Bremsmanö- 108 5 Verfahren zur kinodynamischen Bewegungsplanung Idealer logistischer Raum 1) Stückweise linearer Pfad - Liste mit Wegpunkten von Start zu Ziel - manuell festgelegt oder Ergebnis eines Suchverfahrens 2) Geglätteter Pfad - Vermeidung kinodynamisch ungünstiger Trajektorien 3) Menge homotoper Pfade - heuristische Kollisionsvermeidung 4a) Trajektorie mit Geschwindigkeitsprofil - zeitoptimale Bewegung unter kinodynamischen Zwangsbedingungen 4b) Angepasstes Geschwindigkeitsprofil - sichere Vermeidung von Kollisionen mit existierenden Trajektorien anderer Objekte 5) Zeitoptimale Trajektorie - kollisionsfrei in Bezug auf alle vorher existierenden Trajektorien 6) Regeleinrichtung - Ausführung der Bewegung in der physischen Welt Physischer Raum Abb. 5.4 Bestandteile des Verfahrens ver bei der pfadbeschränkten Trajektorienplanung und führt in der Folge zu höheren Geschwindigkeiten mit den oben genannten günstigen Auswirkun- gen auf die Leistungsfähigkeit. 5.2 Bestandteile und Ablauf des Verfahrens 109 q s‘ q‘ s Abb. 5.5 Homotope Pfade im idealen logistischen Raum Dezentralisierbarkeit Die Dezentralisierbarkeit des Verfahrens unterscheidet sich in Bezug auf die Durchführung des Planungsprozesses und die Ausführung der physischen Bewegung. Für eine dezentrale Planung sind zwei Faktoren von besonderer Bedeutung: • Konsens über Prioritäten Die kritische Eigenschaft für eine dezentrale Koordination der Planungs- prozesse ist die Priorität, mit der die dynamische Hindernisregion be- stimmt wird. Dazu ist es notwendig, eine globale Ordnung zu schaffen, die durch die zentrale Prozessliste in Abbildung 5.3 dargestellt ist. • Austausch existierender Pläne Für eine verteilte Berechnung müssen den Objekten mit niedriger Priori- tät alle Pläne von Objekten mit höherer Priorität zur Verfügung gestellt werden, sodass die dynamische Hindernisregion abgeleitet werden kann. Sobald ein Planungsprozess alle Pläne höher priorisierter Objekte erhalten hat, kann er autonom seine Planung durchführen. Ein effizienter Austausch der Pläne ist von einer effizienten Repräsentation jedes geplanten Pfads τ′ und seiner Zeitsteuerungsfunktion σ abhängig. Aus beiden kann die Zu- standstrajektorie z̃ abgeleitet werden, die Teil der Hindernisregion wird. Dies wird in diesem Verfahren im Wesentlichen durch die Verwendung von Splines erreicht, die in Abschnitt 5.3 beschrieben werden. Eine anschließende dezentrale Ausführung der geplanten Bewegung ist durch die vollständige und kollisionsfreie Planung der Trajektorien von Quel- le zu Senke einfach umzusetzen. Das bewegte Objekt braucht ausschließlich seine eigene Zustandstrajektorie zu kennen, um autonom die physische Be- wegung ausführen zu können, da das Verfahren keine Umplanung erfordert 110 5 Verfahren zur kinodynamischen Bewegungsplanung und neu hinzukommende Objekte die Bewegungen existierender Objekte berücksichtigen. Sobald das Objekt seine Zustandstrajektorie z̃ kennt, sind die folgenden zwei Eigenschaften für die Regeleinrichtung von Bedeutung: • Kontinuierliche Lokalisierung einzelner Teilnehmer Ein bewegtes Objekt verfügt über die Fähigkeit, sich kontinuierlich zu lokalisieren, sodass Abweichungen von der geplanten Trajektorie recht- zeitig erkannt werden können. • Globale Zeitbasis Für eine dezentrale und autonome Ausführung der Bewegungen müssen alle Teilnehmer eine globale Zeitbasis teilen, die sicherstellt, dass die geplanten Bewegungen zum richtigen Zeitpunkt durchgeführt werden. Eine Betrachtung der Dezentralisierbarkeit ist Teil der empirischen Evaluati- on. Echtzeitfähigkeit Für die Bestimmung der Echtzeitfähigkeit wird betrachtet, ob das Verfahren bei Eintritt eines neuen Objekts in eine Quelle die Zeit des Erreichens der gewünschten Senke im Voraus bestimmen kann. Da ein fertiggestellter Bewe- gungsplan über die Zeitsteuerungsfunktion σ den Zeitpunkt des Erreichens der Senke bereits enthält, konzentriert sich die Bestimmung der Echtzeitfä- higkeit auf die Fragestellung, ob das Verfahren die Berechnung eines Plans rechtzeitig vor Beginn der physischen Bewegung abschließen kann. Die Laufzeit des Verfahrens hängt insbesondere von der Bestimmung der Geschwindigkeitsprofile unter Berücksichtigung der Hindernisregion in Verfahrensschritt 4 ab. Eine detaillierte Betrachtung des Laufzeitverhaltens findet sich in Abschnitt 5.6. Es kann gezeigt werden, dass die algorithmi- sche Komplexität von Verfahrensschritt 4 nicht wesentlich schneller als eine lineare Funktion bezüglich der Eingabegrößen n (Anzahl diskreter Betrach- tungspunkte auf dem geglätteten Pfad) und m (Anzahl bereits existierender Pfade mit höherer Priorität) wächst (in O-Notation O( n m )). In der Praxis zeigt sich, dass die Berechnung in sehr kurzer Zeit möglich ist. Eine Echtzeit- fähigkeit des Verfahrens ist gegeben, wenn die Anzahl von gleichzeitigen Bewegungsprozessen auf einen festen Maximalwert mmax begrenzt wird und die Länge möglicher Pfade im Raum auf einen Maximalwert nmax beschränkt wird. Anschließend kann ein fester Wert für die Worst-Case-Laufzeit des Ver- fahrens in Bezug auf einen spezifischen logistischen Raum berechnet werden. Dies ermöglicht eine Echtzeitfähigkeit des Gesamtverfahrens. Im Fall der dezentralisierten Bestimmung der Bewegungspläne muss beachtet werden, dass die Zeiten für die Bestimmmung der Priorität und für die Übertragung der Trajektorien mit höherer Priorität Teil der Worst-Case- Laufzeit sind und somit die Echtzeitfähigkeit beeinflussen. 5.3 Splinebasierte Trajektorien 111 Bewertungsrahmen zur empirischen Evaluation Die Bewertung des Verfahrens im Rahmen der empirischen Evaluation geht auf die Fragestellung ein, ob ein Transportroboter konstruiert werden kann, der die geplanten Trajektorien als physische Bewegung in der realen Welt umsetzen kann (Verfahrensschritt 6). Insbesondere stellt sich die Frage, mit welcher Geschwindigkeit und Beschleunigung in der Praxis gefahren werden kann. Eine weitere Fragestellung ist die Genauigkeit, mit der die Regelein- richtung die Zustandstrajektorie in der Realität abbilden kann, was sich auf den notwendigen Sicherheitsabstand auswirkt, der bei der Planung berück- sichtigt werden muss. Bewertungsrahmen zur simulativen Evaluation Die simulative Evaluation baut auf den Ergebnissen der empirischen Eva- luation auf. Das Ziel ist die Bestimmung der Leistungsfähigkeit eines Lo- gistiksystems, das durch das Verfahren gesteuert wird. Die Bewertung der Leistungsfähigkeit findet im Rahmen der Problemstellung eines Paketsor- tiersystems statt, das durch das Konzept des idealen logistischen Raums beschrieben werden kann. Die zentrale Fragestellung ist, ob das Verfahren für die Bewegungsplanung eines Transportroboterschwarms die Leistungsfä- higkeit eines existierenden Sortiersystems erreicht. 5.3 Splinebasierte Trajektorien Für das Verfahrenwerden Splines als Mittel verwendet, um den genauenWeg durch den logistischen Raum für ein Objekt zu bestimmen. Die eigentliche Trajektorie, die eine exakte Geschwindigkeit und Beschleunigung an jedem einzelnen Punkt des Weges bestimmt, besteht dann aus diesem Weg und einem separat erstellten Geschwindigkeitsprofil, wodurch eine Darstellung der geplanten Bewegung über Raum und Zeit entsteht. Für das Verfahren werden Splines als segmentweise polynomiale para- metrische Kurven in der zweidimensionalen Ebene Q(t) ∈R2 angenommen. Alle Segmente des Splines sind Polynome n-ten Grades. Ein wesentlicher Aspekt von Splines ist die Erfüllung bestimmter Stetigkeitsbedingungen (siehe z. B. [Hug+13], S. 480). Parametrische Stetigkeit Eine parametrische Kurve ist parametrisch stetig im n-ten Grad für den Pa- n rameter t, wenn die n-te Ableitung ddtnQ(t) stetig ist. Sie wird dann auch Cn-stetig genannt. Geometrische Stetigkeit Eine parametrische Kurve gilt als im n-ten Grade geometrisch stetig, wenn n die Vektoren der linken und rechten Grenzwerte der n-ten Ableitung ddtnQ(t) 112 5 Verfahren zur kinodynamischen Bewegungsplanung in ihrer Richtung übereinstimmen, daher müssen sie skalare Vielfache von- einander sein. Für Punkte auf einem Polynom sind diese Stetigkeitsbedingungen immer erfüllt, da Ableitungen beliebigen Grades stetig sind. Daher sind die Verbin- dungspunkte der Polynomsegmente kritisch für die Erfüllung der Stetigkeits- bedingung der Kurve. Im Allgemeinen ist die geometrische Stetigkeit eine Folge der parametrischen Stetigkeit gleichen Grades, es sei denn, die jeweili- ge Ableitung ergibt den Nullvektor. Dann können Situationen entstehen, in denen der Vektor des linken Grenzwerts in eine andere Richtung zeigt als der des rechten Grenzwerts, obwohl beide am Verbindungpunkt den Nullvektor ergeben. Erwünschte Eigenschaften Damit ein bewegtes Objekt in der Lage ist, einer splinebasierten Bahnkurve zu folgen, und die Bahn effizient geplant werden kann, ist es hilfreich, wenn die Splines mehrere Eigenschaften aufweisen, die im Folgenden diskutiert werden. Für das hier entwickelte Verfahren wird von einem holonomischen Be- wegungsmodell der bewegten Objekte ausgegangen: Die steuerbaren Frei- heitsgrade entsprechen genau den Freiheitgraden des logistischen Raums. Daher haben nicht alle Eigenschaften, die Splines bieten können, in dieser Arbeit die Bedeutung, die sie hätten, wenn es sich um nichtholonomische bewegte Objekte handeln würde. Die folgenden Ausführungen zeigen aber die Möglichkeiten von Splines auf, die sie insbesondere im Gegensatz zu git- terbasierten Bewegungsverfahren besitzen. Dabei sollen Eigenschaften, die eine Fahrbarkeit der Spline grundsätzlich beeinflussen, betrachtet werden, da sie sich auch auf die Geschwindigkeit auswirken, mit der gefahren werden kann. Es handelt sich in den meisten Fällen um Stetigkeitseigenschaften. Stetigkeit im Richtungswinkel Zusätzlich zur selbstverständlich gegebenen C0-Stetigkeit in der Position kann es sinvoll sein, dass die Bahnkurve G1- oder C1-stetig ist. Dies hat zur Folge, dass sich der Richtungswinkel des bewegten Objekts ändert. Diese Eigenschaft ist insbesondere dann erforderlich, wenn er sich nicht auf der Stelle drehen kann (z. B. bei einem autoähnlichen Fahrzeugmodell). Stetigkeit in der Krümmung Eine exakte Befahrung von Splines mit unstetiger Krümmung würde bei gleichbleibender Geschwindigkeit sehr hohe, im schlimmsten Fall unendlich hohe Beschleunigungen erfordern. Sprünge im Krümmungsverlauf bedeuten starke, abrupte Kräfte auf das bewegte Objekt und seine eventuelle Nutzlast, die zu Schäden führen können. Eine ineffiziente Lösung ist die Reduzierung 5.3 Splinebasierte Trajektorien 113 der Geschwindigkeit bis hin zum Stillstand. Ein stetiger Krümmungsverlauf ist also in mehrfacher Hinsicht vorteilhaft. Für die Betrachtung der Auswahl einer geeigneten Spline-Familie soll auf die folgende Definition zurückgegrif- fen werden. Die Krümmung κ ist der Kehrwert des Radius einer Kurve und in [Ste15] wie folgt beschrieben: ∣∣ κ = ∣∣dT ∣∣∣∣ ,ds wobei T die Funktion des Tangentenvektors der Kurve und s die Bogenlänge der Kurve ist. Die allgemeine Formel kann man mithilfe des Kreuzprodukts folgendermaßen ausdrücken: Q′(t)×Q′′(t) κ(t) = |Q′(t)|3 . (5.1) Wie aus der allgemeinen Form der Gleichung zu erkennen ist, kann über die Steuerung der ersten und zweiten Ableitung der Kurve eine Steuerung der Krümmung erreicht werden. Die Wahl einer geeigneten Splinefunktion, die stetig in ihrer ersten und zweiten Ableitung ist (C2-Stetigkeit), impliziert damit auch eine Stetigkeit in der Krümmung. Festlegung der ersten und zweiten Ableitung beim Start Um eine Trajektorie, die bereits ausgeführt wird, reibungslos verändern zu können, ist die Fähigkeit zur Erzeugung von splinebasierten Kurven notwendig, die am Startpunkt mit vorher festgelegten Werten für Geschwin- digkeitsvektor und Beschleunigungvektor umgehen können. Auf dieseWeise kann die Bahnkurve eines sich bereits bewegenden Objekts nahtlos verändert werden. Zusätzlich zu den Eigenschaften, die sich günstig auf das Fahrver- halten bzw. die Fahrbarkeit auswirken, werden Eigenschaften benötigt, die sich auf die Planbarkeit der splinebasierten Bahnkurve auswirken. Lokalität Als Lokalität wird die Eigenschaft bezeichnet, die wichtig wird, wenn ein ein- zelnes Segment eines Multisegmentsplines geändert werden soll. Ein Spline besitzt Lokalität, wenn Änderungen an einem einzelnen Segment des Splines nur eine begrenzte Nachbarschaft dieses speziellen Segments betreffen und nicht zu Änderungen für alle Segmente des Splines führen. Mithilfe dieser Eigenschaft entsteht die Möglichkeit, die Form eines Splines lokal zu manipu- lieren (z. B. um ein Hindernis zu umgehen), ohne dass die globale Form des Splines neu berechnet werden muss. Diese Eigenschaft kann auch zu einer effizienten Neuberechnung führen: Ein großer Teil der Parameter des Splines wird nach einer lokalen Änderung gleich bleiben, sodass man erwarten kann, dass die Berechnung für die Aktualisierung weniger aufwändig ist als für 114 5 Verfahren zur kinodynamischen Bewegungsplanung eine globale Änderung der Form des Splines. Korrelation von Form und Parametern Das Ausmaß, in dem die Parameter eines Splines auf einer intuitiven Ebene mit seiner Form übereinstimmen, beeinflusst die Nutzbarkeit eines Splines bei der Planung. Wenn eine Trajektorie durch eine Umgebung geführt wer- den soll, ergibt sich die Aufgabe, einen Spline zu definieren, der bestimmte Punkte durchläuft und bestimmte Bereiche meidet. Diese Aufgabe wird sehr erleichtert, wenn es relativ direkte Zusammenhänge zwischen der Form des Splines und seinen Parametern gibt. Komplexität in der Berechnung Wenn die Berechnung der Splines in kurzer Zeit oder auf einem System mit eng begrenzter Rechenleistung erfolgen muss, dann spielt der Berechnungs- aufwand eine gewichtige Rolle in der Anwendung. Dies kann in Fällen wich- tig werden, wenn der Start des Bewegungsvorgangs durch die Berechnung verzögert wird und damit andere Bewegungsvorgänge blockiert. Zusätzlich ist eine komplexe Spline-Implementierung im Rahmen dieser Arbeit nicht zielführend, da nicht Kernbestandteil des Verfahrens der Kollisionsvermei- dung. Auswahl einer Spline-Familie Eine Einführung in bekannte Splines und eine detaillierte Untersuchung bestimmter Familien finden sich in [Spr08]. Zusammengefasst wird die Dis- kussion in Tabelle 5.1, in der die wichtigsten Eigenschaften der vorgestell- ten Spline-Familien aufgeführt sind. Hermite-Splines und kubische Bézier- Splines sind auf einer segmentweisen Basis definiert. Um diese Splines zu er- zeugen, die aus mehreren Einzelsegmenten (mehreren Polynomen) bestehen, ist sogenanntes Stitching erforderlich. Dabei werden manuell zwei Splineseg- mente so zusammengesetzt, dass die Übergänge den jeweiligen Stetigkeits- bedingungen entsprechen. Im Gegensatz dazu sind Catmull-Rom-Splines und B-Splines so definiert, dass der Stitching-Prozess bereits enthalten ist. Diese bislang genannten Spline-Familien gehören zu den kubischen Splines und werden in vielen Anwendungen genutzt (z. B. in der Computergra- fik). In [Spr08] wird gezeigt, dass kubische Splines zu wenig Freiheitsgrade besitzen, um alle Eigenschaften erfüllen zu können. Die Schlussfolgerung ist, dass auf Splines mit höherer Ordnung zurückgegriffen werden muss, und es wird der Einsatz von Quintischen Bézierkurven vorgeschlagen. Diese können alle Eigenschaften bezüglich der Fahrbarkeit und Planbarkeit erfül- len, sind jedoch mathematisch deutlich komplexer in der Handhabung und berechnungsintensiv. In diesem Zuge soll erwähnt werden, das B-Splines zwar C2-Stetigkeit auf- weisen, aber dafür keine starke und intuitive Korrelation zwische Form und 5.3 Splinebasierte Trajektorien 115 Kontrollpunkten, die wiederum bei kubischen Bézierkurven und Catmull- Rom-Splines gegeben ist. Man kann durch Aufgabe der Lokalität während des Stitching-Prozesses kubische Bézierkurven und Hermite-Splines so zu- sammenfügen, dass eine C2-Stetigkeit gegeben ist. Die resultierenden Splines werden allerdings hochgradig instabil und reagieren auf einzelne Paramete- ränderungen mit einem stark oszillativen Verhalten (vgl. [Spr08]). Tabelle 5.1 Spline-Familien und ihre Eigenschaften Kubisch Quintisch Eigenschaft Hermite Bézier Catmull-Rom B-Spline Bézier Automatisches Stitching - - X X - C1-Stetigkeit X X X X X C2-Stetigkeit - - - X X Verlauf durch Kontrollpunkte X X X - X Starke Korrelation - X X - X Lokalität X X X X X Einfache Berechnung X X X X - Wie in Tabelle 5.1 zu sehen ist, gibt es keine Spline-Familie, die alle erwünsch- ten Eigenschaften bereitstellen kann. Jedoch sind einige Eigenschaften in Bezug auf das zu entwickelnde Verfahren besonders hilfreich: • Automatisches Stitching Da die übergeordnete Wegeplanung als Er- gebnis eine Wegpunktliste liefert, kann bei automatischem Stitching die Splinefunktion diese Liste als Kontrollpunkte übernommen werden, ohne dass ein weiterer Arbeitsschritt bei der Zusammenführung von Segmenten notwendig ist. • C1-StetigkeitDieC1-Stetigkeit ermöglicht eine kontinuierliche Geschwin- digkeitsänderung durch eine nicht-abrupte, weiche Bahnkurve. Alle hier betrachteten Spline-Familien können so angewendet werden, dass sie diese Eigenschaft besitzen. Dies bildet den Hauptunterschied zu allen gitterbasierten Bewegungsverfahren, die Richtungsänderungen nur im rechten Winkel fahren können und daher an Kreuzungspunkten vollstän- dig stoppen müssen. • Verlauf durch Kontrollpunkte, starke Korrelation, Lokalität Ein Kern- bestandteil des in dieser Arbeit entwickelten Verfahrens besteht darin, eine Vielzahl zueinander homotoper Bahnkurven für eine Quelle-Ziel- Relation zu erzeugen. Alle Eigenschaften, die eine solche Erzeugung und Veränderung von Splines unterstützen, sind in diesem Fall sehr vorteilhaft. • Einfache Berechnung Für die Validierung des Verfahrens wird im späte- ren Verlauf der Arbeit die Simulation von einer großen Zahl an bewegten Objekten durchgeführt. In Kombination mit der Erzeugung von homoto- pen Varianten pro Objekt und einer Laufzeit, die anwendungsbedingt, 116 5 Verfahren zur kinodynamischen Bewegungsplanung mehrere Stunden erfordert (z. B. Schichtbetrieb im Logistikzentrum), ergibt sich, dass eine einfache Berechnung der einzelnen Splines einen großen Laufzeitvorteil in der Validierung ermöglicht. Dieser Vorteil kann natürlich grundsätzlich auch in der Praxis relevant werden, wenn sehr große Systeme gesteuert werden sollen. Zur Bedeutung der C2-Stetigkeit lässt sich bemerken, dass sie in der Theoe- rie äußerst wichtig erscheint, da abrupte Beschleunigungsänderungen sich ungünstig auf die Fahrbarkeit auswirken können. In der Praxis hat sich gezeigt, dass im Fall des entwickelten Loadrunners die Fahrbarkeit gege- ben war. Für den dauerhaften Betrieb ist daher eine C2-Stetigkeit sicherlich wünschenswert. Für die Verfahrensentwicklung in dieser Arbeit hingegen kann diese Eigenschaft vernachlässigt werden. Dies ist insbesondere dadurch ermöglicht, dass ein späterer Umstieg auf eine geeignetere, aber schwieriger handhabbare Spline-Familie problemlos möglich ist. Da im hier entwickelten Verfahren keine Splines während der Fahrt verän- dert werden, haben die Eigenschaften der freien Wählbarkeit von Parameter beim Start der Splines in diesem Fall keine Bedeutung. Nach diesen Betrachtungen sind, wie auch gut in Tabelle 5.1 zu sehen ist, für die Verfahrensentwicklung in dieser Arbeit Catmull-Rom-Splines den anderen Familien vorzuziehen. Catmull-Rom-Splines Ein Catmull-Rom-Spline ist durch eine Folge von Kontrollpunkten P1, ...,Pm definiert2. Er führt durch die Kontrollpunkte P1, ...,Pm−1 und der Tangen- tenvektor im Punkt Pi ist parallel zum Vektor Pi−1Pi+1 (vgl. [CR74]). Ein Catmull-Rom-Spline setzt sich aus Segmenten kubischer Polynome zusam- men, die sich Kontrollpunkte teilen, um eine C1-Stetigkeit zu erreichen. Das Segment Si(t) verbindet die Kontrollpunkte Pi−2 und Pi−1 über Si(0) = Pi−2 und Si(1) = Pi−1. Zusätzlich werden für die Bestimmung der Tangenten- vektoren an Pi−2 und Pi−1 jeweils die Punkte Pi−3 und Pi herangezogen. Dies bedeutet, dass der erste und der letzte Kontrollpunkt eines Catmull- Rom-Splines nicht mit der Bahnkurve verbunden sind, sondern nur die Tangentenvektoren am Anfangs- und Endpunkt (mit-)bestimmen. Die formale Definition für einen Catmull-Rom-Spline mit den Kontrollpunk- ten P0, ...,Pm und m > 3 ergibt sich über die Bestimmung der einzelnen Seg- mente. Das i-te Segment mit i ∈ [3,m] ist durch 2 Im Rahmen dieser Arbeit wird von einem zweidimesionalen Weltmodell ausgegangen, so dass ein Punkt P(x,y)mit x,y ∈R2 definiert ist. 5.3 Splinebasierte Trajektorien 117 P P31 P P 20 Abb. 5.6 Beispiel eines Catmull-Rom-Splines S (t) = T ·M · Gii   −1 3 −3 1 Pi−33 2 1  2 −5 4 −1= ( t t t 1 ) 2 −1 0 1 0Pi−2 (5.2)Pi−1 0 2 0 0 Pi gegeben. Der Vektor mit dem Basisspline kann als −t3 + 2t2 − t1 3t3 − 5t2 + 2 B = M · Gi =  2  −3t3 + 4t2 + t t3 − t2 abgeleitet werden. Und über dieBerechnung der Koeffizienzm  atrix −Pi−3 + 3Pi−2 − 3Pi−1 + Pi 1 2P − 5P + 4P − P Ci = M · Gi =  i−3 i−2 i−1 i2 −Pi−3 + + Pi−1  2Pi−2 kann die Gleichung 5.2 als Polynom 1 Si(t) = (−Pi−3 + 3Pi−2 − 3Pi−1 + Pi) t32 1 + (2Pi−3 − 5P 32 i−2 + 4Pi−1 − Pi) t 1 + (−P 2 i−3 + Pi−1)t+ Pi−2 118 5 Verfahren zur kinodynamischen Bewegungsplanung dargestellt werden. Nun lassen sich durch Einsetzen von 0 für den Beginn und 1 für das Ende die Start- und Endpunkte des Splines bestimmen. Durch Si(0) = Pi−2 Si(1) = Pi−1 (5.3) 1 1 S′i(0) = (Pi−1 − Pi−3) S′i(1) = (Pi − P2 2 i−2) (5.4) wird die C1-Stetigkeit gezeigt, da S ′ ′i−1(1) = Si(0) und Si−1(1) = Si0. Des Weiteren kann erkannt werden, dass die Tangente in Pi parallel zum Vektor Pi−1Pi+1 liegt. Die Kontrollpunkte am Anfang und Ende des Splines können dazu ver- wendet werden, die existierende Ausrichtung eines nicht-holonomischen Fahrzeugs anzugeben, sodass dieses eine tatsächlich fahrbare Bahnkurve erhält. In diesem Zusammenhang soll bemerkt werden, dass bei einem holo- nomisch bewegbaren Objekt, wie es in diesem Verfahren zugrunde gelegt wird, die Definition des Splines noch weiter vereinfacht werden kann. Über P0 = −d(P2 − P1) (5.5) Pm = d(Pm−1 − Pm−2) (5.6) mit d > 0 und d ∈ R werden die Tangentenvektoren in P1 und Pm−1, dem Startpunkt und dem Endpunkt der Bahnkurve, in Richtung des nächsten bzw. aus der Richtung des vorherigen Kontrollpunkts gesetzt. Dies ist für ein holonomisch bewegtes Objekt ein gültiges Verhalten, da dieses aus dem Ruhezustand in jede beliebige Richtung anfahren kann. Auf diese Weise kann eine einfache Wegpunktliste W0, ...,Wn mit n > 0 übergeben werden, und es entsteht ohne weitere Schritte eine holonomisch fahrbare Bahnkurve mit der erwünschten C1-Stetigkeit. Diese unkomplizierte Handhabbarkeit vereinfacht Test und Validierung des in der Arbeit entwickelten Verfahrens. Für die Berechnung von Punkten auf einem einzelnen Segment eines Catmull-Rom-Splines wird das rekursive Verfahren von Barry und Goldman verwendet (vgl. [BG88]). Es führt neben den vier Kontrollpunkten P0,P1,P2,P3 zusätzlich vier sogenannte Knotenpunkte t0, t1, t2, t3 ein, die zur Bestimmung des Splines verwende[t√werden. Für Pi ∈Knotenpunkte]sind durchα t 2i+1 = (xPi 1 − xPi ) + (y+ Pi+1 − yP 2i ) + ti (5.7) mit t0 = 0 definiert. Mit dem Parameter α lässt sich die Form der Splines unabhängig von den Kontrollpunkten beeinflussen. Für α = 0,5 wurde nach- gewiesen, dass der Spline keine ungewünschten Eigenschaften wie Spitzen oder Überschneidungen erzeugt (vgl. [YSK09]). 5.4 Numerisches Geschwindigkeitsprofil 119 (a) (b) (c) Abb. 5.7 Unterschiedliche Parametrisierung eines Catmull-Rom-Splines mit (a) α = 0, (b) α = 0,5 und (c) α = 1 Algorithmus 1 Bestimmung eines Punktes auf einem zentripetalen Catmull- Rom-Splinesegment nach Barry und Goldman Eingabe: Zeitpunkt t ∈R+ und Kontrollpunkte P0,P1,P2,P3 mit P(x,y) und x,y ∈R2 Ausgabe: Punkt auf der Spline P 1: α← 12 2: 3: t0← 0[√ ]α 4: t ← [√(xP − xP )21 1 0 + (yP − yP )21 0 ] + t0α 5: t2← [√(xP − xP )22 1 + (yP − yP )22 1 ] + t1α 6: t3← (xP 2 23 − xP2 ) + (yP3 − yP2 ) + t2 7: 8: t← (t2 − t1) · t 9: 10: A1← P t1−t + P t−t00 t1−t0 1 t1−t0 11: A ← P t2−t + P t−t12 1 t2−t1 2 t2−t1 12: A t3−t t−t23← P2 t −t + P3 2 3 t3−t2 13: 14: B t2−t1← A1 t −t + A t−t0 2 0 2 t2−t0 15: B ← A t3−t2 2 t −t + A t−t1 3 1 3 t3−t1 16: 17: P← B t2−t t−t11 t2−t + B1 2 t2−t1 18: 19: return P 5.4 Numerisches Geschwindigkeitsprofil Wie zu Beginn des Kapitels dargestellt, wird die Ausführung der physischen Bewegung durch die Regelung der Aktoren von der Planung der Trajektorie getrennt durchgeführt. An der Schnittstelle liegt ein Zustandsregler, dem für eine präzise Regelung zusätzlich zur Bahnkurve auch ein Geschwindigkeits- 120 5 Verfahren zur kinodynamischen Bewegungsplanung profil zur Verfügung gestellt wird, sodass die zu erreichenden Zielparameter für Position, Geschwindigkeit und Beschleunigung an jedem Punkt der Tra- jektorie feststehen. Ein intuitiver Ansatz wäre es, für die Erstellung des Geschwindigkeitspro- fils auf die erste und zweite Ableitung des Splines zurückzugreifen, um die Geschwindigkeits- und Beschleunigungswerte zu bestimmen. Dazu wird der Spline zu einer Funktion über die Zeit umparametriert, wie z. B. durch eine lineare Abbildung der Zeit auf den internen Splineparameter t. Dieser Ansatz hat den Nachteil, dass sich jegliche Änderung am Geschwindigkeitsprofil über diesen Parameter auf die gesamte Bahnkurve auswirkt. Wenn also zur Erfüllung der kinodynamischen Randbedingungen an einer einzelnen Stelle der Bahnkurve (z. B. an einer scharfen Kurve) die Beschleunigung begrenzt werden muss, führt die Änderung des Splineparameters dazu, dass die ge- samte Trajektorie langsamer durchfahren wird. Dieser Nachteil wirkt sich in einer Umgebung mit vielen sich bewegenden Objekten noch gravierender aus, da eine Änderung der Geschwindigkeiten auf der gesamten Länge der Bahnkurve zu neuen Kollisionen führen kann. Eine alternative Methode, die diese Anpassungen auf die unmittelbare Umgebung der betroffenen Stelle beschränkt, also die Forderung nach Lokalität, ist daher wünschenswert. Struktur des Geschwindigkeitsprofils Die im Folgenden beschriebene Methode orientiert sich im Wesentlichen im Vorgehen nach [Spr08] und ist nicht nur auf Catmull-Rom-Splines be- schränkt, sondern kann auf jede parametrische Kurve oder gitterbasierte, rechtwinklige Pfade angewendet werden. Dieser Umstand ist in doppelter Hinsicht von Vorteil. Das Verfahren kann zum einen zur Berechnung der Bahnkurve modular ausgetauscht werden und ist weniger abhängig von der genauen Implementierung. Zum anderen lässt sich durch die gute Vergleich- barkeit eine Validierung des neuen Verfahrens gegenüber gitterbasierten Kollisionsvermeidungsstrategien durchführen. Ein Geschwindigkeitsprofil besteht aus den Planungspunkten pi = Q(ui), die entlang der Bahnkurve Q(u) verteilt sind und denen translationale Ge- schwindigkeitswerte vi zugeordnet werden. Die Planungspunkte werden idealerweise äquidistant in Bezug auf die Kurvenlänge verteilt, sodass zwei benachbarte Planungspunkte pi, pi+1 ein Intervall auf der Bahnkurve mit der Länge ∆s beschreiben. Für eine exakte Berechnung von s bedarf es einer numerischen Integration für die Bestimmung der Länge des Splines. Zwischen diesen Planungspunkten bewegt sich das Objekt mit einer an- genommenen konstanten positiven oder negativen Beschleunigung. Diese Annahme ermöglicht eine Bestimmung der Zeit, die das Objekt für die Bewe- gung im Intervall von Punkt pi zu Punkt pi+1 benötigt. Sobald die Start- und Zielgeschwindigkeiten vi und vi+1 festliegen, können die Ankunftszeiten ti 5.4 Numerisches Geschwindigkeitsprofil 121 und ti+1 bestimmt werden. Bei n Planungspunkten wird mit der Zeit tn auch direkt die gesamte Durchlaufzeit des Objekts über die Bahnkurve bestimmt. Algorithmus 2 Bestimmung der Planungspunkte und Erzeugung der Daten- struktur Eingabe: Sequenz der Kontrollpunkte c[], Abstand zwischen den Planungspunkten ∆s Ausgabe: Sequenz von Planungspunkten p[] 1: pointsTotal← 0 2: 3: for pos = 1 to pos < |c[]| − 2 do 4: C0← c[pos− 1] 5: C1← c[pos] 6: C2← c[pos+ 1] 7: C3← c[pos+ 2] 8: ⌈ ∥∥∥−−→C C ∥∥⌉1 2∥ 9: numberO f PointsOnSegment← ∆s 10: 11: ∆ ← 1t numberO f PointsOnSegment 12: 13: for i = 0 to i < numberO f PointsOnSegment do 14: p[count+ i]← createPlanningPoint( interpolate( i · ∆t, C0, C1, C2, C3 )) 15: end for 16: 17: pointsTotal← pointsTotal + numberO f PointsOnSegment 18: end for 19: 20: lastWayPointIndex← |c[]| − 2 21: p[pointsTotal]← createPlanningPoint( c[ lastWayPointIndex ] ) 22: return p[] Die Assoziation eines Zeitpunkts ti mit dem jeweiligen internen Spline- parameter ui über die Planungspunkte pi = Q(ui) bildet die Basis für eine Reparametrisierung der Bahnkurve als eine Funktion über die Zeit. Über eine geeignete Interpolation macht diese Reparametrisierung es möglich, für jeden Zeitpunkt, der innerhalb der Durchlaufzeit der Trajektorie liegt, den geplanten Ort, Geschwindigkeitsvektor sowie Beschleunigungsvektor zu bestimmen. Dies bildet die Grundlage für eine laufende Zielanpassung des untergeordneten Regelungsverfahrens, das die Durchführung der Objektbe- wegung steuert. Bewegungsgleichungen Für die Bestimmung der Bewegungsgleichungen wird das Intervall zwi- schen den Planungspunkten pi−1, pi vereinfacht als Strecke der Länge ∆s angenommen. Die hier genannten und weitere in den folgenden Abschnitten verwendeten Formelzeichen sind zur Übersicht in Tabelle 5.2 aufgelistet. 122 5 Verfahren zur kinodynamischen Bewegungsplanung Tabelle 5.2 Abkürzungen und Variablen, die bei der Erzeugung des Geschwindigkeitsprofils verwendet werden Symbol Beschreibung v Translationsgeschwindigkeit vmax maximale Translationsgeschwindigkeit at Translationsbeschleunigung atmax maximale Translationsbeschleunigung c Krümmung az Zentripetalbeschleunigung t Zeit seit Beginn des Bewegungsvorgangs über die Bahnkurve pi i-ter Planungspunkt auf der Bahnkurve ∆s Streckenlänge zwischen zwei Planungspunkten ∆t Zeit für die Bewegung zwischen zwei Planungspunkten Es lassen sich für das Intervall pi−1, pi folgende grundlegende Gleichungen aufstellen: 1 s(t) = att2 + vi−1t, t ∈ [0,∆t], ∆t := ti − ti−1 (5.8)2 v a = i − vi−1 t (5.9)∆t ∆s = s(∆t) (5.10) Die Funktion s(t) steht für den Weg, der seit Beginn des Intervalls zurückge- legt wurde. Die Translationsbeschleunigung at wird innerhalb des Intervalls als konstant angenommen. Die gesamte Streckenlänge des Intervalls wird mit ∆s angegeben. Aus diesen grundlegenden Gleichungen können die ge- schlossenen Formen für ∆t = ti − ti−1 und vi abgeleitet werden (vgl. [Spr08] S. 22 ff): √ v = v 2i i−1 + 2∆sat (5.11) 2∆ ∆ st = (5.12)vi−1 + vi Dabei ist zu beachten, dass negative Werte für die Zeit und die Geschwindig- keit ausgeschlossen werden, es gelten also vi ≥ 0, vi−1 ≥ 0 und ∆t ≥ 0. Mit Gleichung 5.11 lässt sich die Geschwindigkeit eines Planungspunktes aus der Vorgängergeschwindigkeit, der Streckenlänge und der Beschleunigung berechnen. Dies erlaubt eine iterative Bestimmung aller Geschwindigkeits- werte eines Profils. Über Gleichung 5.12 lassen sich bei einem gegebenen Geschwindigkeitsprofil die Durchlaufzeit für die einzelnen Intervalle, die Zwischenankunftszeiten bei den Planungspunkten und somit auch die ge- samte Durchlaufzeit der Bahnkurve bestimmen. 5.4 Numerisches Geschwindigkeitsprofil 123 Berücksichtigung kinodynamischer Zwangsbedingungen Damit die Trajektorie mit ihrem Geschwindigkeitsprofil als Grundlage für ein Kollisionsvermeidungsverfahren verwendet werden kann, ist es notwendig, dass das physische Objekt in der Lage ist, die geplanten Bewegungen mög- lichst exakt nachzuführen. Dazu müssen die jeweiligen kinodynamischen Zwangsbedingungen des zu bewegenden Objekts bei der Erstellung des Geschwindigkeitsprofils berücksichtigt werden. Alle Zwangsbedingungen des physischen Objekts werden zu Zwangsbedingungen der translationalen Geschwindigkeitsvektoren an den Planungspunkten transformiert. Nach [Spr08] wird zwischen isolierten oder beschleunigungsbedingtenZwangs- bedingungen unterschieden. Als isoliert werden diejenigen Zwangsbedin- gungen bezeichnet, die von den Geschwindigkeitsvektoren der benachbarten Planungspunkte unabhängig sind. Ein wichtiges Beispiel ist die maximale Zentrifugalkraft, die auf ein Objekt wirken darf: Sie hängt ausschließlich von der Krümmung und der translationalen Geschwindigkeit an einem betrach- teten Punkt ab. Beschleunigungsbedingte Zwangsbedingungen hingegen hängen von den Geschwindigkeitsvektoren der benachbarten Planungspunk- te ab. Sie garantieren, dass die gewählte Geschwindigkeit an Planungspunkt pi innerhalb der Grenzen bleibt, die durch die Translationsgeschwindig- keit in pi−1 und die maximal zulässige Translationsbeschleunigung bzw. -verzögerung vorgegeben ist. Das im Rahmen dieser Arbeit verwendete Verfahren zur Erzeugung des Geschwindigkeitsprofils berücksichtigt folgende Zwangsbedingungen: • den Stillstand im Start- und Endpunkt, • die maximale absolute Geschwindigkeit vtmax , • die Zentripetalbeschleunigung azmax , die zum Ausgleich der Zentrifugal- kraft bei Fahrt in einer Kurve mit Krümmung c aufgewendet werden muss sowie • die maximale Translationsbeschleunigung und -verzögerung atmax . Die ersten drei Bedingungen können, wie bereits beschrieben, isoliert be- trachtet werden. Für die vierte Bedingung ist eine Betrachtung des jeweils vorhergehenden und nachfolgenden Planungspunkts notwendig. Start- und Endgeschwindigkeit Jeder Bewegungsvorgang startet im Stillstand und endet mit dem Stillstand des zu bewegenden Objekts. Dieser Umstand wird jeweils als Zwangsbedin- gung am ersten und letzten Punkt des Geschwindigkeitsprofils {p0, · · · , pn} abhängig vom Index i formuliert: { 0 für i = 0 vstart = (5.13) ∞ für i > 0 124 5 Verfahren zur kinodynamischen Bewegungsplanung { 0 für i = n vend = (5.14)∞ für i < n Eine Implikation dieser Zwangsbedingungen ist, dass zwei Bewegungsvor- gänge des gleichen Objekts nicht nahtlos mit einer Geschwindigkeit v > 0 nacheinander ablaufen können. Diese Vorgehensweise entspricht dem Be- wegungsmodell der logistischen Standardliteratur (vgl. Abschnitt 5.5). Eine Erweiterung dieses Verfahrens um beliebige Start- und Endgeschwindigkei- ten wäre durch Wahl einer schwieriger handhabaren Spline-Familie möglich (vgl. Abschnitt 5.3) und hätte Auswirkung auf das Verfahren der Kollisions- vermeidung, das von einem stets sicheren Zustand in Start- und Endpunkt ausgeht (vgl. Abschnitt 5.6). Maximale absolute Geschwindigkeit Mit vtmax wird die maximale absolute Geschwindigkeit des physischen Ob- jekts beschränkt. Dies kann z. B. die aus Sicherheitsgründen erlaubte Höchst- geschwindigkeit eines Fahrzeugs sein. Als isolierte Zwangsbedingung gilt sie unabhängig in jedem Planungspunkt. Da Rückwärtsbewegung nicht erlaubt ist, ergibt sich vi ∈ [0,vtmax ]. (5.15) Da in dieser Arbeit von einem holonomischen Bewegungsmodell ausgegan- gen wird, kann der Unterschied zwischen translationaler und rotationaler Geschwindigkeit vernachlässigt werden. Diese Zwangsbedingung impliziert, dass ein Objekt auf einem langen, geradeaus verlaufenden Streckenstück nicht beliebig schnell werden kann. Maximale Zentripetalbeschleunigung Sobald sich das Objekt nicht mehr auf einer geraden Strecke bewegt, erfährt es eine Richtungsänderung beim Durchlaufen der Bahnkurve. Das Maß für diese Änderung ist die Krümmung c, die als Kehrwert des Radius r des Krümmungskreises in jedem Punkt P der Bahnkurve C definiert ist (siehe Abbildung 5.8). Für einen Kreis ist die Krümmung als Verhältnis von Zentriwinkel ∆ϕ und Länge ∆s eines Kreisbogens definiert (vgl. Abbildung 5.9): 1 ∆ϕ = . (5.16) r ∆s Der Zentriwinkel ist gleich dem Außenwinkel zwischen den Kreistangenten in den Endpunkten des Kreisbogens. Die Krümmung κ an einem beliebigen Punkt auf einer Kurve ist als Grenzwert definiert: 5.4 Numerisches Geschwindigkeitsprofil 125 c r P Abb. 5.8 Bahnkurve c und ihr Krümmungskreis mit Radius r im Kurvenpunkt P C s r 𝜋 − φ D φ φ A r B Abb. 5.9 Krümmung am Kreis ∆ dϕ κ := lim ϕ = . (5.17) s→0 ∆s ds Für die Berechnung einer approximierten Krümmung c für einen Planungs- punkt pi im Geschwindigkeitsprofil werden der Vorgänger pi−1 und der Nachfolger pi+1 als Endpunkte eines Kreisbogens auf dem Krümmungskreis von pi betrachtet. Dies ist durch die äquidistante Verteilung der Planungs- punkte möglich. Die Kreistangenten verlaufen durch die Strecken pi−1pi und pipi+1. Ihr Innenwinkel ist als θ = ∠pi−1pipi+1 (5.18) definiert. Der Außenwinkel und damit auch der Zentriwinkel des Krüm- mungskreises ergibt sich entsprechend durch ϕc = π − θ. (5.19) 126 5 Verfahren zur kinodynamischen Bewegungsplanung Damit kann der Krümmungsrad∥ius übe∥−−−→∥ r ϕ rc = pi−1pi∥ · tan c (5.20)2 bestimmt werden. Die maximale Geschwindigkeit in einem Planungspunkt mit Krümmung c ergibt sich aus der maximalen Zentripetalbeschleuni- gung azmax = atmax und dem Krümmungsradius. Die Verwendung von atmax wird durch das holonomische Bewegungsmodell möglich. Damit kann die Zwangsbedingung folgerndermaßen beschrieben werden: vi ∈ √ [0,vzmax ], vzmax = atmaxrc. (5.21) Diese Zwangsbedingung impliziert, dass in engen Kurven keine zu hohen Ge- schwindigkeitsvorgaben an die untergeordnete Steuerung gemacht werden. Die Approximation der Krümmung über die benachbarten Planungspunk- te führt dazu, dass die Genauigkeit der Krümmungsbestimmung über die Anzahl und den Abstand der Planungspunkte gesteuert wird. Maximale Translationsbeschleunigung Die maximale Translationsbeschleunigung atmax ist bei dem hier angenom- menen holonomischen Bewegungsmodell symmetrisch für Beschleunigung und Verzögerung. Die daraus folgende maximale Geschwindigkeit in Pla- nungspunkt pi ist von den Geschwindigkeiten in den Punkten pi−1 und pi+1 abhängig. Durch atmax wird die erreichbare Geschwindigkeit auf einen Wert vi ∈ [vamin ,vamax ] (5.22) festgelegt, wobei die minimalen und maximalen erreichbaren Geschwindig- keiten als vamin =max{ vi−1 − atmax∆t1, vi+1 − atmax∆t2, 0 }, (5.23) vamax =min{ vi−1 + atmax∆t1, vi+1 + atmax∆t2 } (5.24) mit ∆t1 := ti − ti−1 und ∆t2 := ti+1 − ti definiert sind. Über Gleichung 5.11 erhält man eine Darstellung auf Basis der äquidistanten Strecken zwischen den Planungspunkten: √ √ vamin =max{ √ vi− 21 − 2at 2max∆s, √ vi+1 − 2atmax∆s, 0 }, (5.25) va 2 2max =min{ vi−1 + 2atmax∆s, vi+1 + 2atmax∆s } (5.26) 5.5 Bestimmung der Geschwindigkeiten 127 Es ist anzumerken, dass zwischen zwei Planungspunkten entweder positiv beschleunigt oder gebremst werden kann. Damit ist auch hier die Anzahl der Planungspunkte für die Genauigkeit der Steuerung ausschlaggebend. Erfüllung der Zwangsbedingungen Da für alle Zwangsbedingungen eine Gleichung gefunden wurde, die sich ausschließlich auf die Positionen der Punkte pi−1, pi und pi+1 und die maxi- male Beschleunigung atmax bezieht, kann die Erfüllung aller Zwangsbedin- gungen durch das Minimum aller berechneten maximalen Geschwindigkei- ten für den Punkt pi durchgeführt werden: vi←min{vstart,vend,vtmax ,vzmax ,vamax}. (5.27) Durch das holonomische Bewegungsmodell, das ohne Drehbeschleunigung auskommt, entstehen keine Konflikte zwischen gültigen Geschwindigkeits- intervallen bei der Bestimmung einer gültigen Geschwindigkeit. Für kom- plexere Bewegungsmodelle gibt es Verfahren, die diese Problemstellungen lösen (vgl. [Spr08]). Im Rahmen dieser Arbeit reicht zur Validierung der Kollisionsvermeidung das gewählte Bewegungsmodell aus. 5.5 Bestimmung der Geschwindigkeiten Die Erstellung eines Geschwindigkeitsprofils, das die genannten Zwangsbe- dingungen berücksichtigt, geschieht in zwei Phasen: 1. Berechnen der Translationsgeschwindigkeit vi und Ankunftszeit ti für jeden Planungspunkt pi durch Verwendung der Bewegungsgleichungen und mit den genannten Zwangsbedingungen auf dem Intervall pi−1, pi für jeden Planungspunkt mit i ∈ 1, · · · ,n in aufsteigender Indexreihenfol- ge 2. Berechnen der Translationsgeschwindigkeit vi und Ankunftszeit ti für jeden Planungspunkt pi durch Verwendung der Bewegungsgleichungen und mit den genannten Zwangsbedingungen auf dem Intervall pi+1, pi für jeden Planungspunkt mit i ∈ n− 1, · · · ,0 in absteigender Indexreihen- folge Es ist zu beachten, dass bei der Bestimmung der Translationgeschwindigkeit nicht zwingend der maximal mögliche Wert angenommen muss. Weitere Be- dingungen können eine langsamere Bewegung über die Bahnkurve erfordern (wie z. B. zur Kollisionsvermeidung). Ohne solche zusätzlichen Bedingungen wird im Rahmen dieser Arbeit jedoch eine zeitoptimale Bewegung verwendet, bei der die maximal mögliche Beschleunigung und Verzögerung angenom- men wird. Ein solcher Ansatz wird auch Bang-Bang-Methode genannt. Der Name ist lautmalerisch gemeint und beschreibt die Vorgehensweise, mit ma- 128 5 Verfahren zur kinodynamischen Bewegungsplanung Algorithmus 3 Bestimmung der maximalen Geschwindigkeiten für isolierte Zwangsbedingungen Eingabe: Sequenz der Planungspunkte p[], Maximalbeschleunigung atmax , Maximalge- schwindigkeit vtmax , Start- und Endgeschwindigkeit vstart = 0, vend = 0 Ausgabe: Sequenz der maximalen Geschwindigkeiten in den Planungspunkten vmax [] 1: n← |p[]| 2: 3: for i = 1 to i < n− 1 do 4: P0← position( p[i− 1] ) 5: P1← position( p[i] ) 6: P2← position( p[i+ 1] ) 7: 8: ϕc←∥∥∥π −∠−−→∥9: rc← P0P1∥∥P0P1P2· tan ϕc2 10: √ 11: vzmax ← atmax rc 12: 13: vmax [i]←min( vzmax , vtmax ) 14: end for 15: 16: vmax [0]← vstart 17: vmax [n− 1]← vend 18: return vmax [] ximaler Beschleunigung zuerst vorwärts und dann rückwärts die Planungs- punkte zu durchlaufen. Diese Methode gilt als effizienter in der Berechnung als z. B. Ansätze mit dynamischer Programmierung (vgl. [LaV06] Kapitel 14.6.3.5). Zusammenhang mit der analytischen Wegzeitberechnung in der logistischen Standardliteratur Zur analytischen Bestimmung von Wegzeiten werden in der Standardlite- ratur verschiedene Methoden besprochen (vgl. [tSB11, S. 127ff]). Allen ist gemein, dass sie die Zeit t zum Zurücklegen eines Weges wie im vorheri- gen Abschnitt beschrieben aus drei Größen berechnen: der Wegstrecke s, der Geschwindigkeit v und der Beschleunigung a. Genauso wie zwischen zwei Planungspunkten im numerischen Geschwindigkeitsprofil wird die Beschleunigung als konstant angenommen, sodass sich ein linearer Zeit- Geschwindigkeits-Verlauf ergibt. Als einzige kinodynamische Zwangsbedin- gung wird die maximale Geschwindigkeit vmax berücksichtigt. In Abhängig- keit davon, ob diese maximale Geschwindigkeit auf der Wegstrecke s erreicht wird, ergibt sich eine vereinfachte Bewegungsgleichung, die zwischen einer sog. Standardfahrrampe und einer sog. spitzen Fahrrampe unterscheidet: 5.5 Bestimmung der Geschwindigkeiten 129 Algorithmus 4 Zeitoptimale Bestimmung des Geschwindigkeitsprofils unter beschleunigungsbedingten Zwangsbedingungen (Bang-Bang-Methode) Eingabe: Sequenz der Planungspunkte p[], Sequenz der maximalen Geschwindigkeiten in den Planungspunkten vmax [], Maximalbeschleunigung atmax Ausgabe: Sequenz der Geschwindigkeiten in den Planungspunkten v[] 1: n← |p[]| 2: v[0]← 0 3: 4: for i = 1 to i < n do 5: P0← position( p[i− 1] ) 6: P1← p∥ositio∥n( p[i] )7: ← ∥∥−−→8: ∆s √P P ∥ 0 1∥ 9: 10: va← v[i− 1]2 + 2atmax ∆s 11: 12: v[i]←min( va, vmax [i] ) 13: end for 14: 15: v[n− 1]← 0 16: 17: for j = n− 1 to j > 0 do 18: P0← position( p[j] ) 19: P1← p∥ositio∥n( p[j− 1] )20: 21: ∆ ← ∥∥−−→s √P ∥ 0P1∥ 22: 23: va← v[j]2 + 2atmax ∆s 24: 25: v[j− 1]←min( va, v[j− 1] ) 26: end for 27: 28: return v[]  s t = v +√ v ≥ v2a für s a Standardfahrrampe 2 · s v2 (5.28) a für s < a spitze Fahrrampe Der Zusammenhang ist graphisch in Abbildung 5.10 dargestellt. Die Zeiträu- me ∆t+a und ∆t−a beschreiben die Zeit, die zum Beschleunigen bzw. Verzögern aufgewandt wird. Die Fläche, die für diesen Bereich der x-Achse eingeschlos- sen wird, entspricht der zurückgelegten Strecke in diesen Zeitanteilen. Ist die Strecke s ausreichend lang, um vmax zu erreichen, kommt ein dritter Zeitanteil ∆tc hinzu, in dem die Bewegung mit konstanter Geschwindigkeit erfolgt. Es kann gezeigt werden, dass beide Fälle als Spezialfälle des in dieser Ar- beit entwickelten allgemeinen Verfahrens abgebildet werden können. Dazu 130 5 Verfahren zur kinodynamischen Bewegungsplanung Algorithmus 5 Bestimmung der Zeiten und Distanzen im Geschwindigkeits- profil unter Berücksichtigung von Wartezeiten im Stillstand Eingabe: Geschwindigkeitsprofil mit Wartezeiten (p[], v[], twait[]) Ausgabe: Sequenz der Zeitpunkte und Distanzen t[], s[] 1: n← |p[]| 2: 3: t[0]← 0 4: s[0]← 0 5: 6: for i = 1 to i < n do 7: P0← position( p[i− 1] ) 8: P1← p∥osition( p[i] )9: ← ∥∥−−→∥10: ∆s P P ∥0 1∥ 11: 12: s[i]← s[i− 1] + ∆s 13: 14: t[i]← ∆s v[i−1] + 12 v[i] − v[i−1] 15: 16: if v[i− 1] = 0 then 17: t[i]← t[i] + twait[i− 1] 18: end if 19: end for 20: 21: return t[], s[] v v vmax vmax t t ∆t+a ∆tc ∆t− + +a ∆ta ∆ta Abb. 5.10 Standardfahrrampe (links) und spitze Fahrrampe (rechts) wird im zweidimensionalen Raum ein Catmull-Rom-Spline aus den vier Kontrollpunkten P0,P1,P2,P3 gebildet, von denen P1 und P2 als Anfangs- und Endpunkt der Wegstrecke den euklidischen Abstand s besitzen. Die zusätzlich notwendigen Kontrollpunkte P0 und P3 werden anhand von Glei- chung 5.5 und Gleichung 5.6 bestimmt. Aus dieser spezifischen Konstruktion des Splines ergibt sich eine geradlinige Bahnkurve ohne Krümmung, sodass die maximale Zentripetalbeschleunigung als Zwangsbedingung vernach- lässigt werden kann. Die maximale Translationsgeschwindigkeit wird als vtmax = vmax definiert, und zur Berechnung von vamax wird Gleichung 5.26 mit atmax = a verwendet. 5.6 Kollisionsfreie Bewegung mehrerer Objekte 131 Durch die im vorherigen Abschnitt beschriebene Bang-Bang-Methode ent- stehen im Geschwindigkeitsprofil die exakten Geschwindigkeitsverläufe der Fahrrampen aus Abbildung 5.10 genau dann, wenn der Abstand ∆s zwischen 2 den Planungspunkten so gewählt wird, dass ∆s = n va mit n ∈N+ gilt. Daraus folgt, dass die in dieser Arbeit entwickelte Methode in allen logis- tischen Anwendungsfällen eingesetzt werden kann, die auf die klassische analytische Wegzeitberechnung der Standardliteratur zurückgreifen. 5.6 Kollisionsfreie Bewegung mehrerer Objekte Bislang wurde die Bewegung eines einzelnen physischen Objekts isoliert untersucht. Nun soll die Bewegung des Objekts in einer globalen Umgebung betrachtet werden, in der sich bereits eine Mehrzahl von Objekten bewegen. Die Grundlage für eine formale Beschreibung dieser globalen Umgebung ist eine Menge von existierenden Trajektorien T für physische Objekte im logistischen Raum. Der Aufenthalt jedes einzelnen Objekts ist so durch einen Punkt p ∈P und den dazugehörigen Zeitpunkt tp bestimmt. Die Menge P enthält alle Punkte im logistischen Raum, die über die in T enthaltenen Bahnkurven repräsentiert werden. Aus dem Axiom der Trennung folgt, dass Objekte sich nicht zur gleichen Zeit am gleichen Ort befinden können. Da ein physisches Objekt eine räumli- che Ausdehnung besitzt, gibt es für jeden Punkt p mit seinem zugeordneten Zeitpunkt tp eine Nachbarschaft Np ⊂P als Menge aller Punkte, die zum Zeitpunkt tp nicht belegt sein dürfen. Für jeden Punkt q ∈Np mit dem Zeit- punkt tq gilt tq 6= tp. Ein Punkt p, dessen Nachbarschaft zu seinem Zeitpunkt nicht belegt ist, heißt kollisionsfrei. Eine Menge von Trajektorien T , deren Punkte p ∈P kollisionsfrei sind, gilt ebenfalls als kollisionsfrei. In den folgenden Abschnitten soll nun ein Verfahren entwickelt werden, das für eine gegebene Trajektorie T die Kollisionsfreiheit in Bezug auf die Menge von bereits existierenden Trajektorien T sicherstellt. Dazu wird in einem ersten Schritt eine neue Art von zeitbasierter Zwangsbedingung for- muliert, die für Intervalle zwischen den Planungspunkten von T gilt, die Punkte innerhalb der Nachbarschaften bereits existierender Trajektorien enthalten. In einem zweiten Schritt wird die Erfüllung dieser neuen Zwangs- bedingung betrachtet und eine Methode vorgestellt, die durch Veränderung des Geschwindigkeitsprofils eine Kollisionsfreiheit von T in Bezug auf T gewährleistet. Mögliche Kollisionsbereiche Über die Struktur des Geschwindigkeitsprofils von T können die möglichen Kollisionsbereiche mit anderen Profilen aus T anhand der örtlichen Position der Planungspunkte zueinander bestimmt werden. Wenn davon ausgegan- gen wird, dass alle physischen Objekte die gleiche Ausdehnung haben, die 132 5 Verfahren zur kinodynamischen Bewegungsplanung durch einen Kreis mit Radius robj gegeben ist, dann lässt sich die Prüfung auf mögliche Kollisionen auf einen Vergleich zwischen den Planungspunkten reduzieren, solange deren äquidistanter Abstand ∆s so gering ist, dass keine zu großen Lücken entstehen. Unter diesen Voraussetzungen kann eine Nachbarschaft Np für jeden Planungspunkt p ∈ PT definiert werden, die alle Planungspunkte q ∈ PT anderer Trajektorien enthält, deren Distanz dpq < 2robj ist. Im zweidimen- sionalen logistischen Raum kann dpq als euklidische Distanz zwischen den Punkten p(x1,y1) und q(x2,y√2) über dpq = (x1 − x2)2 + (y1 − y2)2 berechnet werden. Mögliche Kollisionsbereiche einer Trajektorie können so über jeden Pla- nungspunkt p ∈ PT identifiziert werden, bei dem Np 6= ∅ ist. Im glei- chen Zuge lassen sich für vollständig disjunkte Trajektorien, bei denen ∀Np ∈ NT ,Np =∅ gilt, Kollisionen grundsätzlich ausschließen. NT bezeich- net dabei die Gesamtheit aller Nachbarschaften aller Planungspunkte einer Trajektorie. In dieser Arbeit wird davon ausgegangen, dass Anfangs- und Endpunkt einer Trajektorie immer kollisionsfrei sind, daher für p0, pn ∈ {p0, · · · , pn} | Np0 = ∅,Npn = ∅ gelten. Sie bilden sichere Bereiche, sodass am Anfang und Ende des Bewegungsvorgangs eine Planungssicherheit bezüglich der Kollisionsvermeidung besteht. Zeitbasierte und kollisionsbedingte Zwangsbedingungen Über die Menge der Nachbarschaften NT können die möglichen Kollisionsbe- reiche auf zeitbasierte Zwangsbedingungen für das Geschwindigkeitsprofil von T abgebildet werden. Die Funktion collT :Np→CT gibt für jeden Planungspunkt pi ∈ {p0, · · · , pn} die Menge Cpi ∈ CT von Zeitintervallen zurück, die Belegungszeiten für Npi angeben, die eine Anwesenheit fremder Objekte innerhalb der Nachbarschaft repräsentieren. Der Punkt pi gilt dann als kollisionsfrei, wenn tpi außerhalb der in Cpi enthaltenen Intervalle liegt. Für jedes Intervall [t1, t2] ∈ Cpi muss gelten tpi < t1 ∨ tpi > t2. Die Erfüllung dieser zeitbasierten Zwangsbedingungen hängt von der Fähigkeit ab, den Zeitpunkt tpi so festzulegen, dass er außerhalb der Be- legungsintervalle liegt. Die validen Werte von tpi hängen jedoch von den Bewegungsgleichungen und kinodynamischen Zwangsbedingungen ab. Aus Gleichung 5.12, Gleichung 5.23 und Gleichung 5.27 ergibt sich: 2∆ 2∆ t s spi−1 + ≤ tv pi ≤ tpi−1 + (5.29)amin min{vstart,vend,vtmax ,vzmax ,vamax} 5.6 Kollisionsfreie Bewegung mehrerer Objekte 133 Eine isolierte Erfüllung der zeitlichen Zwangsbedingungen in pi kann nur in den engen Grenzen der minimal und maximal möglichen Geschwindigkeits- änderung zum vorherigen Planungspunkt pi−1 erfolgen. Zusätzlich ist mit ∆s < 2robj die zur Verfügung stehende Wegstrecke begrenzt. Für eine allgemeine Erfüllung der Zwangsbedingung in pi muss diese bei Bedarf auf die vorherigen Punkte propagiert werden können. Da die Generierung des Geschwindigkeitsprofils zeitoptimal durchgeführt wird, daher mit maximal möglicher Geschwindigkeit, kann eine Veränderung von tpi nur durch eine Verringerung von Geschwindigkeiten erreicht werden. Dazu wird die zeitliche Differenz ∆tcoll definiert, die notwendig ist, um in pi eine Kollision zu verhindern. Zur Bestimmung von ∆tcoll werden alle die Zeitintervalle [t1, t2] ∈ Cpi betrachtet, für die tpi ≥ t1 ∧ tpi ≤ t2 gilt. Wenn t1min der früheste Zeitpunkt ist, an dem die Kollisionsintervalle beginnen, dann ist ∆tcoll = tpi − t1min . (5.30) Mit ∆tcoll ist nun die Zeit bestimmt, die auf der Teilsequenz {p0, · · · , pi} zur Erfüllung der zeitlichen Zwangsbedingung zusätzlich verbracht werden muss. Dies kann durch • Verringerung der Geschwindigkeiten oder • Warten im Stillstand geschehen. Für das Warten im Stillstand muss beachtet werden, dass es nicht in pi stattfinden kann, da hier ja schon die Kollision stattfindet. Es muss daher auf den vorherigen Planungspunkt pi−1 gelegt werden, der nicht kollisions- gefährdet ist. In beiden Fällen kann ein neues Geschwindigkeitsprofil, das in pi kollisionsfrei ist, generiert werden. Die Auswahl einer geeigneten Lö- sungsstrategie muss berücksichtigen, dass jede Veränderung der Zeitpunkte {tp1 , · · · , tpi−1} zu neuen Kollisionen führen kann, die anschließend aufgelöst werden müssen. In den folgenden Abschnitten wird ein Verfahren vorgestellt, das eine möglichst geringe Anzahl an Planungspunkten verändert. In einem ersten Schritt wird dazu eine Methode zur Erlangung der Kollisionsfreiheit in pi ent- wickelt und anschließend, in einem zweiten Schritt, werden neu auftretende Kollisionen in vorausgehenden Punkten aufgelöst. Anpassung des Geschwindigkeitsprofils zur Kollisionsfreiheit in einem Planungspunkt Wie im vorherigen Abschnitt beschrieben, kann eine isolierte Anpassung der Geschwindigkeit in pi nicht ausreichend sein, da die zusätzlich benötigte Fahrtzeitverlängerung ∆tcoll zu lang ist. Wenn zudem einWarten im Stillstand notwendig ist, dann muss dieses außerhalb des Kollisionsbereichs in Punkt pi−1 stattfinden. Daher werden die benötigten Geschwindigkeitsreduktio- nen unter Berücksichtigung der kinodynamischen Zwangsbedingungen auf 134 5 Verfahren zur kinodynamischen Bewegungsplanung die Planungspunkte {p0, · · · , pi−1} verteilt. Es erscheint dabei günstig, dass möglichst wenige Punkte betroffen sind, da so die Änderungen amGeschwin- digkeitsprofil lokal beschränkt bleiben. Die Begründung hierfür ist an dieser Stelle der Arbeit als intuitiv und heuristisch zu sehen. Das ursprüngliche Geschwindigkeitsprofil wurde mit maximaler Beschleunigung zeitoptimal geplant. Im Gegenzug dazu soll hier die gezielte Fahrtzeitverlängerung mit maximaler Verzögerung raumoptimal erfolgen. Das Verfahren beginnt mit der Festlegung einer reduzierten Zielgeschwin- digkeit vi−1red < vi−1 in pi−1 und passt anschließend iterativ die Geschwindig- keiten der vorhergehenden Punkte unter Berücksichtigung der kinodynami- schen Zwangsbedingungen an. Sobald der Punkt pi−x erreicht wird, an dem keine Anpassung mehr notwendig ist, wird die erreichte Fahrtzeitverlänge- rung ∆tadd berechnet. Die genaue Anzahl x an vorhergehenden Punkten, die verändert werden müssen, hängt vom Verlauf des Geschwindigkeitsprofils ab. Wenn ∆tadd ≥ ∆tcoll , dann ist eine gültige Lösung gefunden worden. Damit die Fahrtzeit nicht unnötig verlängert wird, sollte ∆tadd auch nicht deutlich größer als ∆tcoll sein. Die Aufgabe des Verfahrens ist also die Suche nach einer passenden reduzierten Zielgeschwindigkeit vi−1red aus dem Inter- vall [0,vi−1[. Dazu wird initial ∆tadd für vi−1red = 0 bestimmt. Basierend auf dem Ergebnis ergeben sich drei Fälle: • Wenn ∆tadd < ∆tcoll , dann wird in Punkt pi im Stillstand zusätzlich twi−1 = ∆tcoll − ∆tadd gewartet. • Wenn ∆t ∼add = ∆tcoll , dann ist eine adäquate Lösung gefunden. • Andernfalls gibt es eine höhere Geschwindigkeit aus ]0,vi−1[, die be- stimmt werden muss. Im letzten Fall wird so lange eine neue reduzierte Zielgeschwindigkeit über eine binäre Suche im Intervall ]0,vi−1[ bestimmt, bis ∆t ∼add = ∆tcoll . Das erste Ergebnis dieser Methode, die passende reduzierte Zielgeschwin- digkeit vi−1red , wird als neue kollisionsbedingte Zwangsbedingung in pi−1 eingeführt. Das zweite Ergebnis, die Wartezeit twi−1 , wird als neue Struktur in das Geschwindigkeitsprofil aufgenommen. Die neue maximale Geschwin- digkeit in pi−1 ergibt sich aus einer erweiterten Gleichung 5.27: vi−1←min{vstart,vend,vtmax ,vzmax ,vamax ,vi−1red}. (5.31) Anschließend wird ein neues Geschwindigkeitsprofil für die gesamte Trajek- torie mithilfe der Bang-Bang-Methode aus Abschnitt 5.5 generiert. Dabei wird das neu eingeführte Attribut ti−1w berücksichtigt, sodass 2∆ t t spi = pi−1 + + t (5.32)v i−1wi−1 mit 5.6 Kollisionsfreie Bewegung mehrerer Objekte 135 Algorithmus 6 Bestimmung der kollisionsfreien Maximalgeschwindigkeit und Wartezeit in einem Planungspunkt unter Berücksichtigung einer kol- lisionsbedingten zeitlichen Zwangsbedingung (gezieltes Bremsen auf der Bahnkurve) Eingabe: Geschwindigkeitsprofil (p[], v[], t[]), Index des Planungspunktes mit Kollision index, Benötigte Verzögerungszeit tdelay, Schrittweite der iterativen Geschwindigkeits- reduktion ∆v, Maximalbeschleunigung atmax Ausgabe: Kollisionsfreie Maximalgeschwindigkeit im Planungspunkt vmax, Wartezeit twait (bei vmax = 0) 1: 2: if index = 0 then 3: return vmax← 0, twait← tdelay 4: end if 5: ⌊ ⌋ 6: n ← v[index]v ∆ + 1v 7: 8: for xv = 0 to xv < nv do 9: vstart← xv · ∆v 10: vtest← vstart 11: ttest← 0 12: i← index− 1 13: 14: repeat 15: P0← p[i+ 1] 16: P1← p[i] 17: 18: ∆ ← ∥∥∥−−→∥s P0P ∥1∥ 19: 20: v′test← vtest 21: t′test← ttest 22: √ 23: vtest←min( v′ 2test + 2atmax ∆s , v[i] ) 24: 25: t ′ ∆test← t stest + v′ 1 ′test + 2 vtest − vtest 26: 27: i← i− 1 28: until vtest = v[i] 29: 30: toriginal ← t[index− 1] 31: tnew← t[i] + ttest 32: ∆t← toriginal − tnew 33: 34: if ∆t < tdelay then 35: if vstart = 0 then 36: return vmax← 0, twait← tdelay − ∆t 37: else 38: return v ′max← vtest, twait← 0 39: end if 40: end if 41: end for 136 5 Verfahren zur kinodynamischen Bewegungsplanung { ≥ 0 für v t = i−1 = 0 i−1w (5.33)0 sonst. Das neu enstandene Geschwindigkeitsprofil ist in pi kollisionsfrei, jedoch können in den veränderten vorherigen Punkten {pi−x, · · · , pi−1} und nach- folgenden Punkten {pi+1, · · · , pi+y} neue Kollisionen entstehen. Daher wird im nächsten Schritt ein Verfahren zur Erreichung der Kollisionsfreiheit ent- wickelt, das die gesamte Trajektorie berücksichtigt. Iterative Anpassung des Geschwindigkeitsprofils auf der gesamten Trajektorie Das Ziel des Verfahrens ist die Kollisionsfreiheit durch Erfüllung der zeit- lichen Zwangsbedingungen in allen Planungspunkten {p0, · · · , pn}. Dazu werden folgende Schritte durchlaufen: 1. Setze pi := p0. 2. Bestimme die zeitlichen Zwangsbedingungen Cpi , wie in Abschnitt 5.6 beschrieben. 3. Wenn keine Kollision in pi gegeben ist, dann springe zu Schritt 6. An- dernfalls erfülle die zeitlichen Zwangsbedingungen, wie in Abschnitt 5.6 beschrieben, durch Bestimmung einer kollisionsbedingten Maximalge- schwindigkeit und Wartezeit in pi−1. 4. Lösche alle eventuell vorhandenen kollisionsbedingtenMaximalgeschwin- digkeiten und Wartezeiten in den nachfolgenden Punkten {pi, · · · , pn−1}. 5. Generiere ein neues Geschwindigkeitsprofil, das die Punkte {pi−x, · · · , pi+y} verändert. Setze pi := pi−x. Springe zu Schritt 3. 6. Setze pi := pi+1 für i < n und springe zu Schritt 2. Wenn pn erreicht ist, beende das Verfahren. Dieses Verfahren kann als ereignisdiskrete Simulation aufgefasst werden, da die Planungspunkte {p0, · · · , pn}, an denen relevante Ereignisse stattfinden können, in der monoton steigenden zeitlichen Sequenz {t0, · · · , tn} durchlau- fen werden. Der Bewegungsvorgang des Objekts wird so lange auf Basis des jeweils aktuellen Geschwindigkeitsprofils simuliert, bis ein Kollisionsereig- nis auftritt. In diesem Fall wird das Profil aktualisiert und ein sogenanntes Roll-back, ein Sprung auf einen früheren Zeitpunkt, durchgeführt. Dies ist nur deswegen möglich, weil die globale Umgebung zu keinem Zeitpunkt verändert wird, sondern ausschließlich die eigene Trajektorie. Die Simulation wird beendet, wenn ein Geschwindigkeitsprofil gefunden wurde, das ohne Kollisionsereignisse die zeitliche Sequenz {t0, · · · , tn} durchlaufen kann. Aus algorithmischer Sicht ist zu klären, ob das Verfahren auf allen Ein- gaben terminiert und welche Worst Cases und Best Cases es bezüglich der Durchlaufzeit tn und der algorithmischen Laufzeit gibt. Als Eingaben sind 5.6 Kollisionsfreie Bewegung mehrerer Objekte 137 Algorithmus 7 Iterative Anpassung des Geschwindigkeitsprofils Eingabe: Einzeln geplantes Geschwindigkeitsprofil p[], Menge bereits existierender Ge- schwindigkeitsprofile T Ausgabe: Kollisionsfreies Geschwindigkeitsprofil mit kollisionsbedingten Maximalge- schwindigkeiten und Wartezeiten (p[],vmax [], twait[]) 1: n← |p[]| 2: i← 1 3: 4: for j = 0 to j < n do 5: vmax [j]←∅ 6: twait[j]←∅ 7: presences[j]←∅ 8: end for 9: 10: repeat 11: if presences[i] =∅ then 12: presences[i]← computePresences( neighbourhood( p[i], T )) 13: end if 14: 15: ti← time( p[i] ) 16: tdelay← collisionDetection( presences[i], ti ) 17: 18: if tdelay > 0 then 19: vmax [i− 1], twait[i− 1], x← computeVelocityConstraints( p[], i, tdelay ) 20: 21: for j = i to j < n do 22: vmax [j]←∅ 23: twait[j]←∅ 24: end for 25: 26: p[]← computeVelocityProfile( p[], vmax [], twait[], x ) 27: 28: i← i− x 29: else 30: i← i+ 1 31: end if 32: until i = n die zu planende Trajektorie T sowie die globale Umgebung in Form der endlichen Menge an bereits existierenden Trajektorien T gegeben. Terminiertheit Das Verfahren ist genau dann terminierend, wenn nachgewiesen werden kann, dass für alle Eingaben ein Zustand erreicht wird, in dem in Schritt 3 keine Kollisionen mehr festgestellt werden und somit keine Endlosschleife entsteht. Dieser Nachweis wird über die Endlichkeit der Menge T geführt. Wenn mit td die Durchlaufzeit einer Trajektorie aus T definiert wird, dann muss es aufgrund der Endlichkeit der Menge einen Zeitpunkt tdmax für T 138 5 Verfahren zur kinodynamischen Bewegungsplanung geben, nach dem es keine Kollisionen mehr geben kann. Da das Verfahren über die zeitlichen Zwangsbedingungen alle Kollisionen von T für jeden Punkt pi vermeidet, indem es in pi−1 wartet, ist es für alle Eingaben möglich den Zeitpunkt tdmax in p0 abzuwarten und so einen Zustand zu erreichen, in dem keine Kollisionen mehr festgestellt werden. Voraussetzungen für die Terminiertheit sind also die vorab definierte Kollisionsfreiheit in p0, die Endlichkeit von T sowie die Forderung, dass die Trajektorien in T nicht geändert werden dürfen. Best- und Worst-Case-Durchlaufzeit Wenn td die zeitoptimale Durchlaufzeit von T mit T = ∅ ist, dann könnenf rei mit td und tdworst die Best- und Worst-Case-Durchlaufzeiten folgender-best maßen bestimmt werden: td = td (5.34)best f rei tdworst = tdmax + td (5.35)f rei Die Aussagekraft dieser Betrachtung für die praktische Anwendung ist rela- tiv begrenzt, da sie die Anzahl der Trajektorien in T , die Größe des logisti- schen Raums und die Lage der Bahnkurven im Raum nicht berücksichtigt. Eine Veränderung der Lage der Bahnkurven im Raum liefert den Spielraum für die Entwicklung heuristischer Verfahren zur Verbesserung der Durchlauf- zeit. Best- und Worst-Case-Laufzeit Die Laufzeit des Verfahrens ist ein wichtiger Faktor für die praktische An- wendbarkeit. Als Metrik wird hier die Laufzeit lT gewählt, die sich aus den Laufzeiten für jede Operation o ∈O zusammensetzt, die während des Verfahrens beim Besuch eines Planungspunkts durchgeführt werden. Die Funktion l :O→R+ gibt die spezifische Laufzeit für eine Operation zurück. Die Operationen aus O lassen sich in drei Klassen unterteilen: • Einmalige Operationen Für alle Besuche sind in einer einmaligen Ope- ration o1 die Nachbarschaft zu bestimmen und die Kollisionsintervalle zu erstellen. • Wiederholte Operationen Für alle Besuche wird in der Operation o2 geprüft, ob eine Kollision vorliegt. • Zusätzliche Operationen für Besuche mit Kollision Im Fall einer Kol- lision wird in der Operation o3 eine neue, kollisionsbedingte Zwangs- bedingung wie in Abschnitt 5.6 beschrieben eingeführt. Dies kann eine binäre Suche nach der passenden reduzierten Höchstgeschwindigkeit 5.6 Kollisionsfreie Bewegung mehrerer Objekte 139 beinhalten. Anschließend wird in der Operation o4 ein neues Geschwin- digkeitsprofil generiert. Für eine effiziente Bestimmung der Nachbarschaft kann eine raumzeitliche Datenstruktur für T verwendet werden (z. B. ein einfaches Grid oder ein Octree). Die Prüfung auf Kollision besteht aus einem einfachen Test, ob die Zwischenankunftszeit innerhalb eines oder mehrerer Kollisionsintervalle liegt. Im Fall einer erkannten Kollision erhöht sich nicht nur die Berechnungszeit während des Besuchs erheblich (in Relation zu den Besuchen ohne Kollision), sondern es werden durch die Veränderung des Geschwindigkeitsprofils in {pi−x, · · · , pi+y}möglicherweise neue Kollisionen und damit neue Besuche erzeugt. Es müssen alle Punkte {pi−x, · · · , pi−1} erneut besucht und geprüft werden. Da die Anzahl an zusätzlichen Besuchen x durch den individuellen Verlauf des Geschwindigkeitsprofils variieren kann, wird hier in der Worst- Case-Betrachtung von einer mittleren Anzahl x an zusätzlichen Besuchen ausgegangen. Der Best Case ist ein Durchlauf des Verfahrens ohne Kollisionen, die Anzahl der Besuche ist bei einem Geschwindigkeitsprofil {p0, · · · , pn}: lTbest = (n− 2) ( l(o1) + l(o2) ) (5.36) Zusätzlich finden bei den Besuchen keine aufwändigen Operationen der dritten und vierten Klasse statt. Für die Konstruktion eines Worst Case ist eine spezifische Lage der Bahn- kurven im Raum notwendig, die zu zahlreichen Kollisionsereignissen führt. Ein mögliches Worst-Case-Szenario ist in Abbildung 5.11 skizziert. Gegeben ist die Trajektorie T′ mit dem Geschwindigkeitsprofil {p0, · · · , pn} sowie eine Sequenz an existierenden Trajektorien {T0, · · · ,Tm} ∈ T . Die Bahnkurven aller Trajektorien aus T werden so gelegt, dass sie die Bahnkurve von T′ in gegenläufiger Fahrtrichtung durchlaufen. In den Nachbarschaften der Pla- nungspunktsequenz {pn−1, · · · , p1} entstehen so für jede Trajektorie Tj ∈ T Kollisionsintervalle mit monoton steigenden Startzeitpunkten, die als Se- quenz {tjn−1 , · · · , tj1} dargestellt werden. Für T und T0 werden die Geschwin- digkeitsprofile so eingestellt, dass die Zwischenankunftszeit tn−1 in pn−1 im Kollisionsintervall von T0 liegt. Daraufhin erstellt das Verfahren ein neues Geschwindigkeitsprofil für T′, sodass diese Kollision durch Fahrtzeitverzö- gerung vermieden wird. Durch die Lage der Bahnkurven ensteht die nächste Kollision in pn−2, die als nächstes behoben wird. Dieser Ablauf muss für alle Punkte in {pn−1, · · · , p1} durchgeführt werden, bis alle Kollisionen zwischen T′ und T0 aufgelöst sind. Analog werden die Geschwindigkeitsprofile von T1 bis Tm angelegt, sodass das Verfahren für alle Trajektorien in T die maximal mögliche Anzahl an Operationen der dritten Klasse ausführen muss. 140 5 Verfahren zur kinodynamischen Bewegungsplanung Abb. 5.11Worst-Case-Szenario für die Laufzeit des Verfahrens Somit kann die Laufzeit für das Worst-Case-Szenario folgendermaßen ange- geben werden: lTworst = lTbest + (n− 2) m ( l(o2) + l(o3) + l(o4) ) + (n− 2) m x l(o2) (5.37) Die Formel besteht aus der Best-Case-Laufzeit, der Laufzeit für die Kollisions- behandlung sowie der Laufzeit für die durch neue Geschwindigkeitprofile zusätzlich generierten Besuche. Die beiden letzteren Teile werden durch die spezifische Konstruktion des Worst-Case-Szenarios für jede Trajektorie aus T für alle Planungspunkte erneut durchgeführt. Betrachtet man die algorithmische Komplexität, dann kann die Laufzeit in O-Notation als O( n m ) dargestellt werden, sie wächst also nicht wesentlich schneller als eine lineare Funktion bezüglich der Eingabegrößen n (Anzahl Planungspunkte von T) und m (Anzahl bereits existierender Trajektorien in T ). Diskussion des iterativen Verfahrens Die Best Cases und die Worst Cases für Durchlaufzeit und Laufzeit stehen in direkter Korrelation zueinander. Eine Trajektorie mit wenig Kollisionen hat eine kürzere Durchlaufzeit und wird schneller berechnet als eine Trajektorie mit vielen Kollisionen, die lange Wartezeiten hat. Dieser Umstand wird im folgenden Abschnitt für die Entwicklung eines verbesserten Verfahrens verwendet. Das Worst-Case-Szenario lässt sich mit einer einspurigen Straße verglei- chen, die keine Ausweichmöglichkeit bietet und in beide Richtungen befah- 5.6 Kollisionsfreie Bewegung mehrerer Objekte 141 ren werden kann. Es handelt sich in gewisser Weise um einen degenerierten Fall, da es keine freie Verteilung der Bahnkurven im logistischen Raum gibt und sich im Grunde alles in einem eindimensionalen Raum abspielt. Es ist intuitiv zu erkennen, dass das in Abbildung 5.11 abgebildete Szenario durch ein einfaches Verschieben der gegenläufigen Bahnkurven leicht zu einem Best-Case-Szenario ohne jegliche Kollisionen verändert werden kann. Diese Beobachtung bildet die Grundlage für ein heuristisches Verfahren, das in den folgenden Abschnitten entwickelt wird. 5.6.1 Das Verfahren als Zustandsautomat Das iterative Verfahren wird in diesem Abschnitt als Zustandsautomat be- trachtet, der nicht direkt auf den Planungspunkten des Geschwindigkeits- profils operiert, sondern als Eingabe ein Zeitintervall erfordert, das zu einer skalaren Ortsveränderung auf der Bahnkurve führt. Die Darstellung als Zu- standsautomat hat mehrere Eigenschaften, die sich im weiteren Verlauf der Arbeit als vorteilhaft auf folgende Punkte auswirken: • visuelles Verständnis der Kernelemente des Verfahrens • Einführung einer Metrik für die Laufzeitbestimmung anhand der Anzahl der besuchten Zustände • Weiterentwicklung zur Verbesserung der Laufzeit durch ganzheitliche Betrachtung kollidierender Trajektorien (im Gegensatz zu punktueller Betrachtung) • Grundlage für die effiziente (pseudo-)parallele Berechnung mehrerer kollisionsfreier Trajektorien In Abbildung 5.12 wird das im vorherigen Abschnitt entwickelte Verfahren als Zustandsautomat abgebildet. Dessen Struktur besteht aus den Zustän- den s0, s1, s2, s3, se ∈ S der zu planenden Trajektorie T, der Menge an bereits existierenden Trajektorien T und dem aktuell betrachteten Zeitpunkt t. Aus der gegebenen Struktur können die aktuelle Position und die Nachbarschaft abgeleitet werden, sodass eine Prüfung auf Kollisionen möglich ist. Der Au- tomat startet in Zustand s0 mit dem Startzeitpunkt der Trajektorie t = t0 am kollisionsfreien Startort. Das Weiterschalten des Automaten zwischen den Zuständen s0, s1, s2, s3 und se wird durch ein parametrisiertes Triggerereignis ausgelöst, das eine Zeitspanne ∆t als Eingabe akzeptiert, die den nächsten Zeitpunkt tn+1 = tn + ∆t bestimmt. Solange keine Kollision festgestellt wird, bleibt der Automat in Zustand s1, bis das Ende der Trajektorie erreicht wird. Sollte eine Kollision eintreten, dann wird in Zustand s2 der Bremspunkt berechnet und gesetzt und anschließend das Geschwindigkeitsprofil von T in Zustand s3 neu berechnet sowie t zurückgesetzt. Die Zustandsübergän- ge s2→ s3 und s3→ s1 werden durch das Ende der jeweiligen Berechnung ausgelöst. 142 5 Verfahren zur kinodynamischen Bewegungsplanung Abb. 5.12 Verfahren zur Kollisionsvermeidung als Zustandsautomat Der obere Teil von Abbildung 5.12 veranschaulicht die Best Cases bezüglich Durchlaufzeit und algorithmischer Laufzeit des Verfahrens, wenn keine Kol- lisionen auftreten. Wenn der Automat den Endzustand se erreicht, dann gibt der Wert von t die Durchlaufzeit an. Bei einer Kollision wird eine Bremsung und Neuberechnung des Geschwindigkeitsprofils in den Zuständen s2 und s3 durchgeführt und t zurückgesetzt. Der Parameter ∆tmuss in Abhängig- keit von vmax so gewählt werden, dass jede Kollision detektiert wird. Dies bedeutet bei hohen Geschwindigkeiten eine entsprechend feine notwendige Abtastrate. Zur Erstellung einer Metrik für die algorithmische Laufzeit des Zustands- automaten werden die Zustände auf die Operationen aus Abschnitt 5.6 abgebildet. Die Funktion o : S→O gibt die zugeordnete Operation für einen Zustand zurück. Über die Funktion l :O→R+ kann die spezifische Laufzeit für eine Operation bestimmt werden. Eine Zählung der besuchten Zustän- de ergibt die Gesamtlaufzeit. Dabei werden die folgenden Abbildungen definiert: s0 7→ o1, s1 7→ o2, s2 7→ o3 und s3 7→ o4. Betrachtet man das angepasste Worst-Case-Szenario in Abbildung 5.13, dann wird eine zuerst in tc festgestellte Kollision so lange zu neuen Brems- punkten führen bis der Zeitpunkt tw erreicht wird. Je kleiner ∆t gewählt wurde, desto häufiger müssen die Zustände s2 und s3 unnötigerweise be- sucht und damit die teuren Operationen o3 (Bremspunkt berechnen) und o4 (Geschwindigkeitsprofil neu berechnen) durchgeführt werden. 5.6 Kollisionsfreie Bewegung mehrerer Objekte 143 Abb. 5.13 Szenario zur Veranschaulichung der Weiterentwicklung des Verfahrens zur Kollisionsvermeidung Zur Vermeidung der unnötigen Neuberechnung wird der Zustandsauto- mat um zwei Zustände erweitert, die dazu dienen, den gesamten Kolli- sionsbereich der zwei Trajektorien zu bestimmen, bevor der Bremspunkt gesetzt wird. Die neue Struktur des Automaten besteht aus den Zuständen s′ ′ ′ ′ ′ ′ ′ ′0, s1, s2, s3, s4, s5, se ∈ S , der zu planenden Trajektorie T, der Menge an bereits existierenden Trajektorien T und dem aktuell betrachteten Zeitpunkt t des Bewegungsobjekts und dem betrachteten Zeitpunkt tcol des Kollisionsob- jekts. Abbildung 5.14 zeigt den neuen Zustandsautomaten, der im kollisions- freien Fall unverändert bleibt. Im Fall einer Kollision ist t = tc und die kolli- dierende Trajektorie wird mit tcol0 := tc initialisiert. Anschließend wird der Zustand s′2 so lange besucht und dabei die Bewegung über tn+1 = tn − ∆t schrittweise rückgängig gemacht, bis eine kollisionsfreie Position auf der Bahnkurve gefunden wird. Daraufhin geht der Automat in den Zustand s′3 über, der die Vorwärtsbewegung des Kollisionsobjekts auf seiner eigenen Tra- jektorie TK mit tcoln+1 = t col n + ∆t so lange simuliert, bis eine erneute Kollision auftritt oder die Nachbarschaft von T verlassen wird. Das Wechselspiel zwischen den Zuständen s′2 und s ′ 3 führt zur Verdrän- gung des Betrachtungsobjekts entlang der Bahnkurve T, bis eine in Bezug auf TK dauerhaft kollisionsfreie Position erreicht wird, die durch den Zeit- punkt tw gekennzeichnet ist. Der Zeitpunkt t f kennzeichnet den Ort auf der Kollisionstrajektorie TK, an dem die Nachbarschaft von T verlassen wird. Die zwei neu eingefügten Zustände bilden in Bezug auf die Laufzeit fol- genden Operationen ab: s′2 7→ o2 und s′3 7→ o2. Damit müssen die aufwändigen Operation o3 und o4 für jeden zusammenhängenden Konfliktbereich nur ein einziges Mal durchgeführt werden. Die Wartezeit ∆tw am Bremspunkt, der durch den Zeitpunkt tw gekenn- zeichnet ist, kann durch ∆tw = t f − tc bestimmt werden. Dieser wird in Zustand s′ ′4 gesetzt und anschließend wird in s5 ein neues Geschwindigkeits- 144 5 Verfahren zur kinodynamischen Bewegungsplanung profil erstellt, das zum Zeitpunkt tw so lange die Bewegung verzögert, bis das Kollisionsobjekt auf TK den gemeinsamen Konfliktbereich verlassen hat. Abb. 5.14 Zustandsautomat für das weiterentwickelte Verfahren zur Kollisionsvermeidung Die Modellierung des Verfahrens als Zustandsautomat erlaubt eine schritt- weise Ausführung über die parametrisierte Triggerfunktion adv’. Über diese Funktion werden die Zustandsübergänge von s′ bis s′0 4 ausgelöst sowie der Übergang von s′1 zum Endzustand s ′ e. Die beiden Übergänge von s′ ′4 zu s5 und von s′5 zu s ′ 1 werden automatisch durch das Ende der jeweiligen Operationen ausgeführt. Ein Nachweis über die Terminiertheit des Zustandsautomaten, also die Garantie, dass bei jeder Eingabe nach einer endlichen Folge von Trig- gerereignissen der Zustand s′e erreicht wird, kann analog zur Argumentation in Abschnitt 5.6 erfolgen. Über diese Architektur lassen sich mehrere Trajek- torien schrittweise pseudoparallel zur Kollisionsfreiheit transformieren, was im folgenden Abschnitt verwendet wird. 5.6 Kollisionsfreie Bewegung mehrerer Objekte 145 5.6.2 Heuristische Verbesserung Wie die konstruierten Worst-Case-Szenarien in Abbildung 5.11 und Abbil- dung 5.13 veranschaulichen, bedarf es in vielen Konfliktfällen einer Ver- schiebung der Bahnkurven im logistischen Raum, damit eine konfliktfreie Bewegung möglich wird. Aus dieser Betrachtung heraus soll die heuristische Annahme getroffen werden, dass durch konfliktfreie Berechnung einer Mehr- zahl von homotopen Trajektorien in vielen Fällen eine Trajektorie gefunden werden kann, die wenige oder gar keine Konflikte erzeugt. Abb. 5.15 Trajektorien auf der Basis homotoper Bahnkurven zwischen q und s (Screenshot des entwickelten Simulationswerkzeugs) Abbildung 5.15 zeigt homotope Bahnkurven im freien logistischen Raum, die Quelle qmit Senke s verbinden. Die Bahnkurven orientieren sich an der optimalen Bahnkurve mit der kürzesten Durchlaufzeit für ein einzelnes Ob- jekt. Ziel ist die Suche nach einer Lösungstrajektorie mit wenigen Konflikten, die nur geringe Abweichungen von der optimalen Bahnkurve hat. Algorithmus 8 zeigt den Pseudocode für die Berechnung der Trajektorie mit der kürzesten Durchlaufzeit. Er erwartet als Eingabe eine Liste von Kan- didatentrajektorien K , die gegen die Menge der existierenden Trajektorien T getestet werden. Zusätzlich wird mit ∆t der Zeitraum angegeben, der den inkrementellen Fortschritt der Zustandsautomatensimulation bestimmt und der von der Maximalgeschwindigkeit der bewegten Objekte abhängt. Die Ausgabe ist diejenige kollisionsfreie Trajektorie, deren Geschwindig- keitsprofil die kürzeste Durchlaufzeit aller Kandidaten hat. Bei mehreren gleichwertigen Lösungen wird die zuerst gefundene ausgegeben. In den Zeilen 1 bis 5 wird für jeden Kandidaten ein Zustandsautomat initiali- siert. Anschließend werden in einer Endlosschleife alle Zustandsautomaten über die Funktion adv’ mit dem Zeitraum ∆t weitergeschaltet (siehe Zeile 9). Wenn ein Zustandsautomat den Endzustand s′e erreicht, wird der Algo- 146 5 Verfahren zur kinodynamischen Bewegungsplanung Algorithmus 8 Berechnung der Trajektorie mit der kürzesten Durchlaufzeit Eingabe: Liste der Kandidatentrajektorien K , Menge der existierenden Trajektorien T , Schrittweite der Simulation ∆t Ausgabe: Zeitoptimale, kollisionsfreie Trajektorie Tresult 1: for i = 0 to i < |K | do 2: statei← s′0 3: timei← 0 4: coltimei← 0 5: end for 6: 7: loop 8: for i = 0 to i < |K | do 9: Ki, statei, timei, coltimei← adv’(∆t,Ki,T , statei, timei, coltimei) 10: if state ′i = se then 11: Tresult←Ki 12: return Tresult 13: end if 14: end for 15: end loop rithmus mit der gefundenen kollisionsfreien Trajektorie als Rückgabewert beendet. Die Terminiertheit jedes einzelnen Zustandsautomaten garantiert, dass in endlicher Zeit ein Automat den Endzustand s′e erreicht und somit die Endlosschleife verlassen wird. Damit ist die Terminiertheit von Algorithmus 8 gegeben. Durch das sequenzielle, schrittweise Weiterschalten mehrerer Zustands- automaten wird ein Round Robin Scheduling umgesetzt. Jeder Zustands- automat erhält die begrenzte Zeitscheibe ∆t, für deren Simulation er die Berechnungen durchführt. Dies führt dazu, dass die Berechnung für die Kandidatentrajektorie mit der kürzesten Durchlaufzeit zuerst fertiggestellt wird und alle anderen Berechnungen abgebrochen werden können. Der Erfolg der Heuristik hängt wesentlich von der Generierung der Kan- didatentrajektorien ab. Je mehr Kandidaten berücksichtigt werden, desto wahrscheinlicher ist das Auffinden einer Trajektorie mit wenigen Kollisionen. Mit einer steigenden Anzahl erhöht sich jedoch der Berechnungsaufwand innerhalb eines Durchlaufs der Endlosschleife. Kapitel 6 Evaluation Zusammenfassung Das sechste Kapitel widmet sich der empirischen und simulativen Evaluation des entwickelten Verfahrens. Zunächst wird die Ar- chitektur der physischen Testbedumgebung beschrieben, die eine Evaluati- on nach dem Konzept des Cyberphysischen Zwillings ermöglicht und die Schnittstelle zwischen Empirie und Simulation bildet. Anschließend wer- den die kinodynamischen Grenzwerte eines einzelnen realen Roboters, des Loadrunners, bestimmt. Die nachfolgenden Abschnitte befassen sich mit einer Simulationsstudie, mit der die Leistung eines Loadrunner-Systems bei der Sortierung von Paketen untersucht wird. Es zeigt sich, dass ein solches System die Leistung eines klassischen Sortiersystems mit Stetigfördertechnik deutlich übertreffen kann. Das Kapitel schließt mit einer kritischen Reflexion der in der Einleitung aufgestellten Hypothesen. 147 148 6 Evaluation Die Evaluation des entwickelten Verfahrens zur Bewegungsplanung gliedert sich in einen empirischen und einen simulativen Teil. Im empirischen Teil werden die kinodynamischen Grenzwerte eines einzelnen realen Roboters untersucht, der auf Basis der splinebasierten Bewegungsplanung gesteuert wird. Das Ziel ist die Bestimmung einer maximalen Beschleunigung, mit der für beliebige Trajektorien die dazugehörigen Geschwindigkeitsprofile so berechnet werden, dass der Roboter sie physisch befahren kann. Kernelement der empirischen Phase ist ein Testbed für die Entwicklung Cyberphysischer Zwillinge. Es besteht aus einer freien Versuchsfläche, die den idealen logistischen Raum darstellt, einem System zur kontinuierli- chen Beobachtung aller Objekte und einem Simulations- und Steuerungspro- gramm zur virtuellen Abbildung des Verhaltens des physischen Roboters. Sowohl Simulationsprogramm als auch Roboter verwenden das gleiche Ver- fahren zur Bewegungsplanung, sodass eine simulierte Bewegung anhand der kontinuierlichen Beobachtungen validiert werden kann. Dazu werden die Beobachtungsereignisse laufend an die Simulation übertragen. Das Ziel der simulativen Evaluationsphase ist die Bestimmung der Leis- tung einer großen Zahl von Transportrobotern in einem logistischen An- wedungsszenario. Dazu wird das Simulationsprogramm des Testbeds ver- wendet, sodass die individuellen Bewegungen der simulierten Roboter dem validierten Verhalten des realen Roboters gleichen. Die validierte Grenzbe- schleunigung aus der empirischen Phase sichert die Bewegungsplanung der simulativen Phase auch für eine größere Anzahl an simulierten Robotern, da der Grundcharakter der Trajektorienplanung unverändert bleibt. 6.1 Testbed für die Entwicklung Cyberphysischer Zwillinge Als Testbed für die empirische Evaluation dient das Innovationslabor Hybride Dienstleistungen in der Logistik, das vom Lehrstuhl für Förder- und Lager- wesen FLW der Technischen Universität Dortmund gemeinsam mit dem Fraunhofer-Institut für Materialfluss und Logistik IML betrieben wird. Sei- ne Multisensor-Referenzumgebung ermöglicht den physischen Nachbau logistischer Szenarien [Zei+17]. Innerhalb des Labors wird eine Fläche von 22m× 15m× 4m durch ein Motion-Capturing-System (MoCap-System) be- obachtet. Das Labor befindet sich in einer Leichtbauhalle, die baugleich mit her- kömmlichen Industriegebäuden im Logistikbereich ist, und folgt dem Grund- konzept einer hochflexiblen Entwicklungsumgebung, deren Versuchsfläche frei von fest installierten Gewerken bleibt. Diese Versuchsfläche wird wäh- rend der emiprischen Evaluation als physisches Abbild des idealen logisti- schen Raums verwendet. 6.1 Testbed für die Entwicklung Cyberphysischer Zwillinge 149 Die Halle ist mit mehreren Beobachtungssystemen ausgestattet, die an der Decke, an den Wänden und im Boden installiert sind. Im Rahmen der empirischen Evaluation wird ausschließlich das MoCap-System verwen- det. Es besteht aus 50 Infrarotkameras des Herstellers Vicon und kann eine große Zahl von retroreflektiv markierten Objekten verfolgen. Es liefert Lo- kalisierungsdaten mit einer Genauigkeit von 0,3mm und arbeitet mit einer Datenübertragungsrate von bis zu 300Hz. Die Lokalisierungsdaten sind über das Netzwerk für mehrere Empfänger gleichzeitig zugänglich und liefern die Position und Rotation der markierten Objekte im dreidimensionalen Raum. Neben einfachen physischen Objekten stehen mehrere Marker-Anzüge zur Personenortung zur Verfügung, deren Daten als komplexe, digitale Skelett- modelle bereitgestellt werden. Abb. 6.1 Gesamtansicht des Testbeds während des Betriebs3 Abbildung 6.1 zeigt eine exemplarische Nutzung des Testbeds. Die Person, der Roboter und der Behälter werden vom MoCap-System beobachtet. Acht Laserprojektoren decken den Versuchsraum ab und können farbige Vektor- grafiken auf den Boden projizieren. Im Vordergrund projiziert das Lasersys- 3 Quelle:©c Fraunhofer-Institut für Materialfluss und Logistik / Michael Neuhaus 150 6 Evaluation tem eine visuelle Darstellung der aktuellen internen Datenstrukturen der Robotersteuerung. Architektur der Entwicklungsumgebung Die Architektur der Entwicklungsumgebung basiert auf dem Konzept des Cyberphysischen Zwillings. Abbildung 6.2 zeigt schematisch das Zusam- menspiel der Infrastruktur. Alle markierten Objekte, die sich auf der Ver- suchsfläche befinden, werden über ein MoCap-System lokalisiert und über eine Netzwerkverbindung in die Simulationsumgebung übertragen und dort abgebildet. Neben der Abbildung physischer Objekte kann die Simulation be- liebig viele rein virtuelle Objekte enthalten, die (noch) keine Repräsentation im physischen Raum besitzen. Simulationsumgebung virtuelle Objekte physische Repräsentation virtueller Raum Laserprojektion MoCap-System nicht markierte Objekte passiv Mensch Roboter markierte Objekte idealer logistischer Raum (physische Versuchsfläche) Abb. 6.2 Architektur der Entwicklungsumgebung des Testbeds Zu Beginn der Entwicklung befindet sich die gesamte übergeordnete Steue- rungslogik zentral in der Simulationsumgebung, die einfache Bewegungs- anweisungen an die Robotersysteme sendet und resultierende Objektbe- wegungen über die MoCap-Verbindung erhält. Virtuelle Objekte, die keine physische Repräsentation haben, werden über das Laserprojektionssystem auf dem Hallenboden gespiegelt. Wenn keine physischen Objekte gesteu- ert werden, dann können die virtuellen Roboter- und Objektbewegungen zeitlich beschleunigt simuliert werden. In späteren Entwicklungsphasen wird die übergeordnete Steuerungslo- gik schrittweise dezentralisiert und von der Simulationsumgebung auf die physischen Roboter übertragen. Dies geschieht manuell durch Neuimplemen- tierung in der Programmiersprache des Zielsystems. Als Beispiel verwendet das aktuelle System C# in der Simulation sowie Python und C++ innerhalb einer Robotersteuerung. 6.2 Empirische Evaluation 151 6.2 Empirische Evaluation Für die empirische Evaluation wird ein Transportroboter verwendet, der gemeinsam von Forschern des Lehrstuhls FLW und des Fraunhofer IML entwickelt wurde. Die Feldversuche im Testbed weisen nach, dass mit dem sogenannten Loadrunner ein Roboter existiert, der die geplanten Trajektorien und Geschwindigkeitsprofile des in dieser Arbeit entwickelten Verfahrens sicher fahren kann. Beschreibung des Loadrunners Der Loadrunner ist ein Transportroboter, der als Hardwareplattform in ver- schiedenen Konfigurationen für unterschiedliche logistische Anwendungen konzipiert ist. Ein Ziel bei der Entwicklung des Roboters waren Geschwindig- keit und Beschleunigung, die deutlich höher als bei existierenden Robotern oder Fahrerlosen Transportfahrzeugen in der Logistik sind. Ein weiteres Ziel war die Unterstützung von Verfahren zur Bewegungsplanung für eine große Anzahl von Robotern. Dies soll durch einen möglichst hohen Grad an Manövrierfähigkeit gewährleistet werden. Dazu wurde der Loadrunner als holonomischer Roboter entworfen. Er kann sich daher omnidirektional bewegen und seine Rotation ist unabhängig von der Fahrtrichtung. Dies wird durch Einsatz von Allseitenrollen erreicht, in diesem Fall sogenannte Omniwheels. Abb. 6.3 Designstudie des Loadrunners4 Abbildung 6.3 zeigt Unter- und Oberseite des Loadrunners in seiner Kon- figuration als Transportroboter für Pakete. Mit vier Direktantrieben über getriebelose Asynchronmotoren und einer Leistung von jeweils 3,6kW kön- nen theoretisch Geschwindigkeiten von über 30m/s erreicht werden. Bei einer Höhe von 14cm und einem Durchmesser von 55cm hat die Plattform ei- ne Nutzlast von 30kg. Dies ermöglicht zahlreiche Anwendungen im Bereich der Intralogistik. Je nach Einsatzszenario kann die Plattform mit unterschied- lichen Lastaufnahmemitteln ausgestattet werden. 4 Quelle:©c Fraunhofer-Institut für Materialfluss und Logistik 152 6 Evaluation Parallele Entwicklung und Evaluation Die Entwicklung des Loadrunners erfolgte nach dem Konzept des Cyber- physischen Zwillings. Dementsprechend wurde die Simulationsumgebung des Testbeds parallel zum physischen Roboter entwickelt. Abbildung 6.4 zeigt die virtuelle Abbildung der Versuchsfläche mit 3D-Modellen mehrerer Loadrunner. Das in dieser Arbeit beschriebene Verfahren zur splinebasierten Trajektorienplanung mit Geschwindigkeitsprofil wurde für die Simulati- onsumgebung und den Loadrunner gleichzeitig programmiert. Über die Datenanbindung des MoCap-Systems können die berechneten Trajektorien mit dem tatsächlichen Fahrverhalten abgeglichen werden. Abb. 6.4 Simulationsumgebung für die Entwicklung und Evaluation des Loadrunners Über einen iterativen Entwicklungsprozess wurde das Verhalten der Simulati- on und des physischen Roboters soweit angeglichen, bis eine praxistaugliche Übereinstimmung erreicht wurde. Über eine Benutzeroberfläche kann eine manuelle Bewegungsplanung durchgeführt werden, bei der die Kontrollpunkte der Splines einzeln gesetzt und verändert sowie erlaubte Beschleunigungen und Höchstgeschwindig- keiten für das Geschwindigkeitsprofil vorgegeben werden. Diese manuellen Trajektorien werden an die Loadrunner übertragen, die versuchen, die so geplante Bewegung durchzuführen. Für die empirische Evaluation wurde die Bewegungsplanung für ein Pa- ketsortierszenario auf der Versuchsfläche mit acht Loadrunnern manuell in der Simulation durchgeführt. Dabei wurde schrittweise die maximale Be- schleunigung und Geschwindigkeit so weit erhöht, bis die kinodynamischen Grenzwerte des Loadrunners erreicht wurden. 6.3 Simulationsstudie 153 Ergebnisse Die empirische Untersuchung ergibt, dass der Loadrunner jegliche splineba- sierte Bahnkurve mit einem Geschwindigkeitsprofil der Bewegungsplanung unter folgenden kinodynamischen Zwangsbedingungen mit einer sehr ge- ringen Abweichung befahren kann: • Beschleunigung Der Loadrunner kann sicher alle Bahnkurven mit Geschwindigkeitsprofil fahren, die mit einer maximalen Beschleunigung von 4m/s2 berech- net werden. Es ist aus den praktischen Versuchen plausibel, dass eine Beschleunigung von 5m/s2 durch technische Verbesserungen erreicht werden kann. • Geschwindigkeit Aufgrund der beschränkten Ausmaße des Testbeds konnte eine Höchst- geschwindigkeit von 12m/s in der Praxis getestet werden. Höheren Geschwindigkeiten steht prinzipiell nichts entgegen, bis auf eine mecha- nisch bedingte Grenzgeschwindigkeit des Loadrunners selbst und die Fähigkeit zur Lokalisierung bei hohen Geschwindigkeiten. Aus den prak- tischen Versuchen erscheint eine Geschwindigkeit von 25m/s plausibel erreichbar, wenn genug Platz vorhanden ist. Mit der empirischen Untersuchung können die kinodynamischen Zwangs- bdingungen als Grundlage für eine Simulationsstudie verwendet werden, die eine Leistungsbestimmung für Systeme mit einer großen Anzahl an Loadrunnern ermöglicht. 6.3 Simulationsstudie Mit der Simulationsstudie soll die Hypothese H5 belegt werden, nach der ein Hochleistungssortiersystem mit klassischer Stetigfördertechnik durch einen Schwarm hochdynamischer Transportroboter ersetzt werden kann (vgl. Ab- schnitt 1.3). Dazu wird als Szenario ein Paketsortiersystemmit Loop-Struktur verwendet, für das eine klassische Leistungsberechnung existiert (vgl. Ab- schnitt 2.1). Es wird anschließend ein Simulationsmodell eingeführt, das die gleichen Ein- und Ausgangspunkte für Pakete wie das herkömmliche Sortier- system besitzt, jedoch anstelle der Stetigfördertechnik einen Schwarm von Loadrunner-Fahrzeugen zum Transport einsetzt. Zur Bewegungsplanung wird der Algorithmus aus Kapitel 5 verwendet. Die zu beantwortende Fragestellung ist, ob durch die Simulation der Loadrunnerbewegungen eine vergleichbare Leistung in Anzahl Paketen pro Stunde wie bei einem herkömmlichen Hochleistungssortiersystem nachge- wiesen werden kann. Wenn dies der Fall ist, dann ist eine zweite Fragestel- lung, mit welcher Anzahl an Loadrunner-Fahrzeugen die gleiche Leistung 154 6 Evaluation erreicht wird und bei welcher Anzahl an Fahrzeugen eine Grenzleistung erreicht wird. Szenario Hochleistungssorter im Paketzentrum Als Szenario für die Simulationsstudie wird auf die Arbeit von Kai Semrau zur analytischen Leistungsermittlung von Stückgutsortiersystemen zurück- gegriffen (vgl. [Sem15]). Seine analytischen Berechnungsmethoden wurden durch eine Simulation validiert, bei der ein Sorter mit Loopstruktur ver- wendet und die Plausibilität der Formeln anhand der Simulationsergebnisse nachgewiesen wird (vgl. [Sem15] S. 99ff). Dieses Modell wird genutzt, um die Leistungsfähigkeit der Bewegungsplanung des Loadrunners mit einem her- kömmlichen Sorter zu vergleichen. Durch die Verwendung der validierten analytischen Berechnungsmethoden von Semrau ist eine erneute Simulation des herkömmlichen Systems nicht erforderlich. Ausschleusbereich ... ... Ausschleusbereich Abb. 6.5 Loop-Sorter mit einem Einschleusbereich Abbildung 6.5 zeigt das Schema eines Loop-Sorters mit einem Einschleus- bereich und einem Ausschleusbereich, dessen Endstellen sich auf die zwei Längsseiten der Fläche verteilen. Der Verteilförderer verbindet die Bereiche und bildet den Kern des Sortiersystems. Leistungsbestimmung eines stetigen Verteilförderers Die Berechnung der Nennleistung eines stetigen Verteilföderers erfolgt nach Semrau (vgl. [Sem15] S. 15, Formel 2.1). Er verwendet typische in der Realität vorkommende Parameter für die Geschwindigkeit und die Aufteilung des Tragmittels. So ergibt sich folgende Nennleistung: vv 2m/sPNenn = c · = 1 · = 9000 Stk./h (6.1)e 0,8m Einschleusbereich 6.3 Simulationsstudie 155 Bemerkenswert ist, dass die Nennleistung des Verteilförderers ausschließ- lich von seiner Geschwindigkeit vv, der Teilung e und der Anzahl paralleler Tragmittel c abhängig ist. Die Größe der Fläche und die Anzahl an Aus- schleusungen haben keinen Einfluss auf die Leistung. Wenn die Leistung der Einschleusungen gewährleistet, dass zu jeder Zeit alle Plätze auf dem Verteilförderer belegt werden, dann entspricht die Gesamtleistung der Nenn- leistung mit Pges = PNenn. (6.2) Da alle Pakete während eines Umlaufs an den Endstellen abgegeben werden, sind die Plätze auf dem Verteilförderer vollständig frei, wenn sie wieder am Einschleusbereich eintreffen. Solange die Einschleustechnik in der Lage ist, ein Paket sicher auf einen freien Platz zu bewegen, gibt es keine Konfliktsi- tuationen im Sinne einer Bewegungssteuerung. A2 ... E1 E2 ... A1 Abb. 6.6 Loop-Sorter mit zwei Einschleusbereichen (E1, E2) und zwei Ausschleusbereichen (A1, A2) Dies ändert sich, wenn mehrere abwechselnde Ein- und Ausschleusbereiche eingeführt werden, wie Abbildung 6.6 am Beispiel von zwei Einschleusberei- chen zeigt. In diesem Fall entstehen Konfliktsituationen immer dann, wenn ein Paket an einem anderen Einschleusbereich vorbeifährt, um sein Ziel zu erreichen. Der Platz ist belegt und kann zu diesem Zeitpunkt nicht von der betroffenen Einschleusung genutzt werden. Dies führt zu einer Leistungs- minderung in Bezug auf die dortige Einschleusleistung. Die Gesamtleistung eines Loop-Sorters mit zwei Einschleusungen wird von der Anzahl an Paketen beeinflusst, die ein Blockieren von Plätzen an der nächsten Einschleusung verursachen, an der sie auf demWeg zum Ziel vorbeifahren müssen. Die Parameter p12 und p21 bezeichnen den jeweiligen Anteil an Paketen, deren Quelle-Senke-Relation einen solchen blockierenden Weg vorgibt. Dabei folgt die Benennung der Parameter dem Muster pEA mit 156 6 Evaluation E als Nummer des Einschleusbereichs und A als Nummer des Ausschleusbe- reichs. Bei einer Gleichverteilung auf die Endstellen gilt p12 = p21 = 0,5. Auf dieser Basis kann die Gesamtleistung für das erweiterte Szenario wie folgt bestimmt werden (vgl. [Sem15] S. 37, Formel 3.18): 2− p − p 2− 0,5− 0,5 Pges = P 12 21 Nenn · 1− p12 · = 9000 · p21 1− · = 12000 Stk./h (6.3) 0,5 0,5 Eine Verdoppelung der Einschleusbereiche führt also nicht zu einer Verdop- pelung der Gesamtleistung. Die Erhöhung der Leistung beschränkt sich auf die Pakete, die an einem Einschleusbereich erfolgreich einen freien Platz bekommen und vor dem nächsten Einschleusbereich den Verteilförderer wieder verlassen. Bei einer Gleichverteilung der Ziele ergibt sich ein Leis- tungszuwachs von 30 Prozent. Die Einfachheit der analytischen Berechnungsmethode für den Verteil- förderer wird durch die Reduktion der Dimensionalität des Raums erreicht. Der Konfigurationsraum der Loopstruktur ist im Grunde mit einem Band vergleichbar, das durch den physischen Raum gelegt wird und dessen Enden miteinander verbunden sind. Dies entspricht einer 1D-Mannigfaltigkeit, die das Bewegungsplanungsproblem trivial lösbar macht. Es gibt immer genau einen Weg, den ein Paket von der Quelle zur Senke befahren kann. Durch die gleichmäßige Geschwindigkeit des Förderers entfällt die Betrachtung der ki- nodynamischen Rahmenbedingungen. Das Problem der Konflikte zwischen Bewegungsvorgängen konzentriert sich ausschließlich auf den Einschleusvor- gang. Wenn ein Paket einmal auf dem Förderer liegt, dann kommt es sicher an der Senke an und wird dort ausgeschleust. Damit kann die technische Wahrnehmungsfähigkeit gezielt auf Ein- und Ausschleuspunkte reduziert werden und muss nicht kontinuierlich erfolgen (durch Barcodescanner und Lichtschranken). Diese Vorteile werden durch die umfangreiche statische Infrastruktur erkauft, die beim Aufbau des Systems erforderlich ist. Die me- chanischen Zwangsbedingungen, die den sicheren Transport der Pakete ohne kontinuierliche Beobachtung und Regelung ermöglichen, sind gleichzeitig die Ursache der fehlenden Flexibilität und schwachen Wandelbarkeit des Systems. Sortierung auf Basis des Loadrunners Die Verwendung des Loadrunners zur Paketsortierung ersetzt die stetig fördernde Loopstruktur durch einen Schwarm unstetig fördernder Transpor- troboter. Wie in Abbildung 6.7 zu sehen ist, bleiben die Ein- und Ausschleus- bereiche des Systems an der gleichen Position. Die Einschleusungen werden durch Abholstationen ersetzt, an denen die Loadrunner Pakete aufnehmen und anschließend zum Zielort bringen. Damit verändert sich der Konfigu- rationsraum für die Bewegungsplanung zu einer 2D-Mannigfaltigkeit, und 6.3 Simulationsstudie 157 Konflikte werden auf der gesamten zur Verfügung stehenden Fläche gelöst. Durch die Komplexität der Bewegungsplanung im freien Raum ist keine einfache analytische Berechnung der Leistungsfähigkeit möglich, sondern es bedarf einer Simulation des Sortiervorgangs, die das Verfahren der Bewe- gungsplanung beinhaltet. A ... Lastfahrt Leerfahrt E E idealer logistischer Raum ... A Abb. 6.7 Loadrunner-Sortiersystem auf Basis des idealen logistischen Raums Der größte Unterschied ergibt sich durch die Unstetigkeit des Loadrunner- Systems. Die Bewegung eines Loadrunners ist eine sich abwechselnde Abfol- ge von Leerfahrten zur Lastaufnahme und Lastfahrten zur Lastabgabe (vgl. Abbildung 6.7). Konflikte können prinzipiell nur dann entstehen, wenn sich die Wege zweier Quelle-Senke-Relationen kreuzen. Damit ergibt sich eine Leistungssteigerung durch direkte kurze Wege von der Quelle zur Senke durch die Vermeidung unnötiger Konflikte. Leistungsmindernd sind die notwendigen Leerfahrten nach Lastabgabe. Zielvorgabe für die Leistung und Szenario Als Zielvorgabe für die zu erreichende Leistung werden 12000 Stk./h ange- setzt. Dieser Wert entspricht einer typischen Leistung für einen Loop-Sorter mit zwei Einschleusbereichen. Diese Zielleistung basiert zum einen auf dem Beispiel von Kai Semrau, zum anderen wurde sie von Logistikexperten des Fraunhofer IML und aus der Industrie als realitätsnah bestätigt. Architektur der Simulation Die Architektur der Simulation baut auf dem Konzept des Cyberphysischen Zwillings auf und verwendet für die Bewegungsplanung dieselben Algo- rithmen, die innerhalb des realen Loadrunners zum Einsatz kommen. Im Gegensatz zu klassischen Simulationswerkzeugen der Logistik, die für ei- nen globalen Zeitschritt die Ereignisse aller Objekte gleichzeitig berechnen, 158 6 Evaluation wird der inhärent abgebildete Zeitfortschritt der Geschwindigkeitsprofile einzelner Loadrunner als Grundlage verwendet. Die zentrale Datenstruktur der Simulation ist die nach Startzeitpunkten geordnete Liste der Geschwindigkeitsprofile. Darauf aufbauend werden die Prozesse des Sortiervorgangs durch geeignete Trajektorien abgebildet. Der Zeitfortschritt der Simulation orientiert sich an den Geschwindigkeitsprofilen der Bewegungsplanung. Das jeweils nächste Ereignis, das im Sinne einer ereignisdiskreten Simulation bearbeitet wird, ist die Ankunft eines Loadrun- ners an der Endposition seiner aktuell befahrenen Trajektorie. Die Simulation läuft in folgenden Schritten ab: • Initialisiere: Zu Beginn der Simulation werden alle Loadrunner gleich- mäßig auf die Warteschlangen der Einschleusungen (Quellen) verteilt. • Wiederhole: Falls sich Loadrunner in den Warteschlangen befinden, pla- ne für den ersten Loadrunner einer der Warteschlangen eine neue Tra- jektorie mit Geschwindigkeitsprofil, die aus Lastfahrt zur Senke und anschließender Leerfahrt zu einer Warteschlange besteht. DieWarteschlangen für die Loadrunner sind sichere Start- und Zielpunkte im Sinne der Bewegungsplanung und führen zu einer Deadlock- und Livelock- Freiheit des Systems. Ihre Kapazität kw wird über die Anzahl Loadrunner nlr und die Anzahl Einschleusungen ne mit kw = nlr/ne berechnet. Bei der Pla- nung einer neuen Trajektorie wird eine zufällige Senke als Zielpunkt für die Lastfahrt festgelegt und die diesem nach euklidischer Distanz nächste Warte- schlange mit freier Kapazität gewählt. Damit verteilen sich die Loadrunner im Verlauf der Simulation gleichmäßig auf die Quellen. Die Warteschlangen für Pakete werden in dieser Arbeit als unbeschränkt angesehen und die Ziele werden gleichverteilt zufällig generiert. Es ist immer ein Paket vorhanden, wenn ein Loadrunner eine neue Trajektorie plant. Die Berechnung der Bewegungsplanung kostet in der Simulation keine Zeit, es wird davon ausgegangen, dass die Berechnung schon zu dem Zeitpunkt abgeschlossen ist, an dem ein Loadrunner ein Paket übernimmt. Das ist eine Abstraktion, die in der Simulation zur Vereinfachung angenommen wird, aber in der Praxis durchführbar ist. Voraussetzung ist, dass ein Paket rechtzeitig an der Einschleusung identifiziert wird, noch bevor der Trans- port beginnt. Dies wird durch das entwickelte Verfahren ermöglicht, dessen Bewegungsplanung auf Basis einer Heuristik schnell zu berechnen ist. 6.3.1 Versuchsdurchführung Die Versuche werden für ein Basisszenario und ein erweitertes Szenario mehr- fach mit unterschiedlichen Parametern durchgeführt, um einen Eindruck vom Einfluss auf die Leistungsfähigkeit zu gewinnen. Die Versuchsdurch- führung berücksichtigt folgende Aspekte: 6.3 Simulationsstudie 159 • Bestimmung der Leistung ohne Kollision Für die Bestimmung der Leistung ohne Kollision bewegen sich die Loadrunner ohne Kollisionsvermeidung. Sie fahren im Konfliktfall durch- einander durch. Die so ermittelte Leistung stellt eine obere Grenze für die theoretisch mögliche Leistung in einem gegebenen Szenario dar. • Bestimmung der Leistung mit Kollisionsvermeidung In diesem Fall bremsen die Loadrunner, um eine Kollision zu vermeiden, oder sie verwenden einen alternativen Weg. Die Grenzleistung ist gegen- über der Leistung ohne Kollision vermindert. Die Grenzleistung wird erreicht, wenn so viele Loadrunner im System sind, dass kein Leistungs- zuwachs mehr möglich ist, da zu viele Konflikte erzeugt werden. • Variation des Sicherheitsabstands In der empirischen Evaluation wurde nachgewiesen, dass der Loadrun- ner so genau fährt, dass die Bewegungsplanung mit einem Durchmesser von 60cm erfolgreich durchgeführt werden kann. Bei einer angenomme- nen geringeren Genauigkeit in großen Systemen kannmit einer Erhöhung des Sicherheistabstands auf 80cm gearbeitet werden. Die Versuche werden für beide Szenarien jeweils mit einer maximalen Be- schleunigung von 4m/s und 5m/s durchgeführt, um die aktuell erreichbare Leistung sowie die plausibel erwartbare Leistung zu bestimmen. Die Versuche werden mit einer ansteigenden Anzahl von Loadrunnern durchgeführt. Der erste Versuch wird mit 10 Loadrunnern durchgeführt. In nachfolgenden Läufen wird die Anzahl jeweils um jeweils 10 weitere Loadrunner erhöht, bis die Anzahl von 100 Loadrunnern erreicht wird. Basisszenario Das Basisszenario ist ein direkter Leistungsvergleich zwischen einem Loop- Sorter mit zwei Einschleusbereichen und einen Loadrunner-System (siehe Abbildung 6.7). Das entsprechende Szenario wird in der Simulation mit 50 Senken und 8 Quellen abgebildet (siehe Abbildung 6.8). Die Senken werden in zwei Bereiche aufgeteilt, sodass 25 Senken an der oberen Seite der Grund- fläche und 25 an der unteren Seite positioniert sind. Die Quellen werden an der linken und der rechten Seite positioniert. Die Gesamtfläche beträgt 113m × 25m. Die Länge ergibt sich aus der Anzahl der Senken an einer Längsseite (25), der Breite der Endstelle an einer Senke von 1,2m, dem Zwischenabstand von 2,8m und einem Offset von 6,5m amAnfang und am Ende. Die Quellen werden mittig an den Stirnseiten angeordnet und haben einen Zwischenabstand von 4m bei einem Abstand von 6,5m zu den Längsseiten. Eine Versuchsreihe beginnt mit einer Anzahl von 10 Loadrunnern, die mit jedem weiteren Versuchslauf um 10 erhöht wird, bis zu einer Maximalan- zahl von 100 Loadrunnern. Für jeden Versuch werden 3 Simulationsläu- 160 6 Evaluation Abb. 6.8 Screenshot des Basisszenarios vor dem Start der Simulation Abb. 6.9 Screenshot des Basisszenarios mit 100 Loadrunnern während der Simulation fe mit unterschiedlichem Sicherheitsabstand für die Kollisionsvermeidung durchgeführt: 80cm,60cm und 0cm. Mit dem letzten Wert wird die Kolli- sionsvermeidung abgeschaltet. Abbildung 6.9 zeigt einen Screenshot eines Simulationslauf mit 100 Loadrunnern. ·103 25 20 15 Zielleistung 80cm 10 60cm 00cm 5 0 0 20 40 60 80 100 Anzahl Loadrunner Abb. 6.10 Leistungswerte des Loadrunners im Basisszenario bei 4m/s2 Abbildung 6.10 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen Beschleunigung von 4m/s2. Die theoretische Zielleistung ohne Kollisionsbe- trachtung wird mit 58 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher- heitsabstand werden 68 Loadrunner benötigt und bei 80cm Durchmesser steigt die Anzahl auf 70 Loadrunner. Stk. / h 6.3 Simulationsstudie 161 ·103 25 20 15 Zielleistung 80cm 10 60cm 00cm 5 0 0 20 40 60 80 100 Anzahl Loadrunner Abb. 6.11 Leistungswerte des Loadrunners im Basisszenario bei 5m/s2 Abbildung 6.11 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen Beschleunigung von 5m/s2. Die theoretische Zielleistung ohne Kollisionsbe- trachtung wird mit 53 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher- heitsabstand werden 59 Loadrunner benötigt und bei 80cm Durchmesser steigt die Anzahl auf 60 Loadrunner. Erweitertes Szenario Das erweiterte Szenario verändert das Layout zugunsten des Loadrunner- Systems, indem es die Quellen gleichmäßig zwischen die Senken verteilt (siehe Abbildung 6.12). Auf diese Weise werden die Leerfahrten verkürzt, da der Rückweg an die nächste Stirnseite entfällt. Alle Quellen und Senken befinden sich an den Längsseiten. Die gleichmäßge Verteilung der Quellen führt zu einer Gruppierung der Senken. An jeder Längsseite entstehen so 5 Gruppen mit 5 Senken, die durch eine Quelle getrennt werden. Die Gesamtfläche beträgt 117,2m× 25m. Die Länge ergibt sich aus der Anzahl der Senken an einer Längsseite (25), der Breite einer Quelle von 1,2m und dem Zwischenabstand von 2,8m. Die 4 Quellen werden zwischen die Senken verteilt und beanspruchen einen Zwischenabstand von 7,8m. In Abbildung 6.13 ist ein Screenshot vor Beginn der Simulation zu sehen, während Abbildung 6.14 die Situation während eines Simulationslaufs mit 100 Loadrunnern zeigt. Abbildung 6.15 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen Beschleunigung von 4m/s2. Die theoretische Zielleistung ohne Kollisionsbe- trachtung wird mit 52 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher- Stk. / h 162 6 Evaluation A E A A E A ... Leerfahrt Lastfahrt ... A E A A E A Abb. 6.12 Layout des erweiterten Szenarios vor dem Start der Simulation Abb. 6.13 Screenshot des erweiterten Szenarios vor dem Start der Simulation Abb. 6.14 Screenshot des erweiterten Szenarios mit 100 Loadrunnern während der Simulation heitsabstand werden 58 Loadrunner benötigt und bei 80cm Durchmesser steigt die Anzahl auf 70 Loadrunner. Abbildung 6.16 zeigt die Ergebnisse einer Versuchsreihe mit einer maximalen Beschleunigung von 5m/s2. Die theoretische Zielleistung ohne Kollisionsbe- trachtung wird mit 47 Loadrunnern erreicht. Bei 60cm Durchmesser Sicher- heitsabstand werden 50 Loadrunner benötigt und bei 80cm Durchmesser steigt die Anzahl auf 57 Loadrunner. 6.3.2 Ergebnisse Die durchgeführten Versuche ergeben, dass das Loadrunner-Sortiersystem die Leistung eines klassischen Sortiersystems mit Loopstruktur in allen Sze- narien nicht nur erreichen, sondern deutlich übertreffen kann. Das Bewe- gungsplanungsverfahren im idealen logistischen Raum führt zu einer direk- 6.3 Simulationsstudie 163 ·103 25 20 15 Zielleistung 80cm 10 60cm 00cm 5 0 0 20 40 60 80 100 Anzahl Loadrunner Abb. 6.15 Leistungswerte des Loadrunners im erweiterten Szenario bei 4m/s2 ·103 25 20 15 Zielleistung 80cm 10 60cm 00cm 5 0 0 20 40 60 80 100 Anzahl Loadrunner Abb. 6.16 Leistungswerte des Loadrunners im erweiterten Szenario bei 5m/s2 ten Skalierbarkeit der Systemleistung, die über die Anzahl der Fahrzeuge gesteuert wird. Es zeigt sich, dass der Einfluss des Layouts über die mittlere Länge der Leerfahrten den größten Einfluss auf die Systemleistung hat. Damit hängt die Gesamtleistung unmittelbar von der Anzahl an Senken und den dazuge- hörigen Endstellen ab, die das System bereitstellen muss. Je mehr Endstellen es gibt, desto mehr Leistung ist im System rechnerisch möglich und desto Stk. / h Stk. / h 164 6 Evaluation mehr Fahrfläche ist vorhanden. Je mehr Fahrfläche vorhanden ist, desto mehr Fahrzeuge sind einsetzbar und damit umso mehr Leistung möglich. Dies ist ein grundlegender Unterschied zum stetigen Verteilförderer, dessen Leistung unabhängig von seiner Länge und der Anzahl an Endstellen ist. Es kann beobachtet werden, dass die ausschließliche Anordnung der Quel- len und Senken an den Längsseiten zu deutlich mehr Kollisionen führt, da die Bewegungsplanung häufiger in Situationen kommt, bei denen Frontalkollisio- nen vermieden werden müssen. Es enstehen spontan Warteschlangen auf der Fläche, die sich ungünstig auf die Systemleistung auswirken. Das führt dazu, dass der Einfluss von Sicherheitsabstand und maximaler Beschleunigung im erweiterten Szenario eine deutlichere Ausprägung erhält. Die Ergebnisse repräsentieren einen direkten Leistungsvergleich, der die zusätzliche Flexibilität des Loadrunner-Systems nicht berücksichtigt. Bei- spielsweise werden keine Sperrguttransporte simuliert, die ein stetiger Ver- teilförderer nicht transportieren kann. 6.4 Kritische Reflexion der Hypothesen Mit der abgeschlossenen Evaluation des entwickelten Verfahrens können die anfangs aufgestellten Hypothesen zum logistischen Raum einer kritischen Reflexion unterzogen werden. H1. Der ideale logistische Raum ist leer, kontinuierlich und kinodyna- misch. Der informelle Begriff des idealen logistischen Raums kann durch die Nut- zung der Raumbegriffe der formalen Bewegungsplanung der Robotik un- tersucht werden. Der Nachweis dieser Hypothese wird in dieser Arbeit nicht direkt geführt, sondern indirekt in der Axiomatik der Logistik als Ex- tremwert eines Kontinuums möglicher logistischer Räume definiert. Dieser entspricht dem Raum des idealisierten Förderwesens, der keinerlei Lagerung von Objekten vorsieht, sondern sich ausschließlich mit der Bewegungspla- nung befasst. Wenn die Vermeidung von Lagerung, wie z. B. im Sinne einer Just-In-Time-Methodologie, als Ziel der Logistik angesehen wird, dann ist der leere logistische Raum das zu erreichende Ideal. In diesem Fall wird durch das entwickelte Verfahren gezeigt, dass ein kontinuierliches Weltmodell mit Berücksichtigung kinodynamischer Zwangsbedingungen von Vorteil ist und daher als Grundlage für den idealen logistischen Raum dienen muss. Die Idee des idealen logistischen Raums ist insofern vor allem für die wissenschaftliche Betrachtung der Logistik interessant und in der Praxis nur in den Fällen anwendbar, wo tatsächlich keine Lagerung notwendig ist. H2. Eine axiomatische Definition der Logistik ist auf Basis des Konzepts des idealen logistischen Raums möglich. 6.4 Kritische Reflexion der Hypothesen 165 Diese Hypothese wird in der Arbeit durch die entwickelte Axiomatik nach- gewiesen. Die mathematische Grundlage der Axiomatik „befreit“die Logis- tikwissenschaft von der Konzentration auf existierende Systeme und ihre praktischen Einschränkungen. Die starke Ähnlichkeit der Grundlagen mit der theoretischen Bewegungsplanung der Robotik ermöglicht eine weitrei- chende Übertragung von Erkenntissen auf die Logistik. Dies ist insbesondere für Themenbereiche interessant, in denen keine Roboter eingesetzt werden. Da es sich um die erstmalige Aufstellung einer Axiomatik der Logis- tik handelt, muss diese als ein „erster Wurf“ angesehen werden, dessen Allgemeingültigkeit in dieser Arbeit nicht nachgewiesen wird. Eine wich- tige Erkenntnis der Axiomatik ist die Unterscheidung von gitterbasierten Weltmodellen für das idealisierte Lagerwesen und kontinuierlichen Weltmo- dellen für das idealisierte Förderwesen. Dies ermöglicht die Bestimmung einer grundlegenden Forschungslücke in der Logistik. Die anschließende Verfahrensentwicklung zur Schließung dieser Lücke erhält so eine allgemeine Bedeutung, da sie ein grundsätzliches Problem der Logistik löst und nicht nur eine weitere Logistikanwendung unter vielen repräsentiert (wie z. B. die Paketsortierung mit Robotern). H3. Es gibt einen effizient durchführbaren Planungsalgorithmus für eine Vielzahl von bewegten Objekten im idealen logistischen Raum. Mit dem in dieser Arbeit entwickelten Verfahren wird diese Hypothese be- stätigt. Es ist eine effiziente heuristische Bewegungsplanung für den idealen logistischen Raum und insofern allgemeingültig, als sie nicht für eine spezifi- sche Anwendung entwickelt wurde. Es ist jedoch kein optimales Verfahren, und es ist eine Vielzahl von Verbesserungen vorstellbar. Aus Sicht der Robotik basiert das Verfahren auf bekannten Methoden der Bewegungsplanung. Der Nachweis seiner Leistungsfähigkeit für die Paketsortierung zeigt erfolgreich die Vorteile einer kontinuierlichen und kinodynamischen Bewegungspla- nung im idealen logistischen Raum. Damit kann das entwickelte Verfahren als Benchmark verwendet werden, dessen Leistungsfähigkeit als Messlatte für zukünftige Entwicklungen dient. H4. Eine dezentrale Steuerung logistischer Systeme auf Basis des Pla- nungsalgorithmus lässt sichmit demKonzept des Cyberphysischen Zwil- lings umsetzen. Es kann durch Verfahrensentwicklung gezeigt werden, dass eine Dezentrali- sierung der Bewegungssteuerung über die modularen Bestandteile des Ver- fahrens möglich ist. Eine Skalierbarkeit ergibt sich direkt aus dem Verfahren selbst (es können beliebig viele Objekte gesteuert werden). In der Evaluation wird mit dem eingesetzten Testbed die Entwicklung nach dem Konzept des Cyberphysischen Zwillings demonstriert. Hier ist insbesondere die empi- rische Validierung der grundlegenden kinodynamischen Fähigkeiten der 166 6 Evaluation Loadrunner von Bedeutung, die es ermöglicht, die Leistungsbestimmung auf Basis der abstrakten Bewegungsplanung vorzunehmen (im Gegensatz zu ei- ner vollständigen Simulation aller physischen Bestandteile des Loadrunners). Der Aufbau der Simulation auf der Bewegungsplanung zeigt, wie durch das Konzept des Cyberphysischen Zwillings erreicht werden kann, dass sich das virtuelle Abbild des bewegten Objekts genauso verhält wie das physische Objekt. H5. Ein Hochleistungssortiersystem mit klassischer Stetigfördertechnik kann durch einen Schwarm hochdynamischer Transportroboter ersetzt werden. Dem Nachweis dieser Hypothese widmet sich das Kapitel der Evaluation. Der Nachweis beschränkt sich auf den direkten Vergleich der Leistungswerte in Paket pro Stunde. Er befasst sich nicht mit den Vorteilen, die aus der erhöhten Flexibilität entstehen, die eine reduzierte Infrastruktur bietet. Der Leitgedanke hinter dieser Vorgehensweise ist, dass ein direkter Leistungs- vergleich die grundlegenden Vorteile hochdynamischer Transportroboter aufzeigen kann. Wenn das neue Verfahren schon ohne Ausnutzung der Flexi- bilität eine höhere Leistung als klassische Systeme erreicht, dann wird es in anspruchsvolleren Szenarien, bei denen Flexibiltät von Vorteil ist, vergleichs- weise noch bessere Leistungswerte erreichen. Künstliche Intelligenz Die Fähigkeit zu einer kontinuierlichenWahrnehmung physischer Objekte ist eine Grundvoraussetzung dieser Arbeit. Sie wird durch die erwarteten Fort- schritte in der Künstlichen Intelligenz, insbesondere des Maschinellen Ler- nens, die Erkennung physischer Objekte erst ermöglichen. Dementsprechend sind die Ergebnisse dieser Arbeit direkt von der Entwicklung entsprechender objekterkennender Verfahren abhängig. Auch wenn diese Arbeit sich im Kern nicht mit Künstlicher Intelligenz befasst, gewinnt die Aufstellung einer Axiomatik der Logistik vor ihrem Hintergrund eine weitere Bedeutung. Wenn logistische Modelle zukünftig automatisiert erlernt werden sollen, dann kann die Axiomatik als Grundlage für eine Bewertung dienen. Der Cyberphysische Zwilling ist als Konzept so angelegt, dass eine Inte- gration von Künstlicher Intelligenz in der Simulation naheliegend ist. Eine Frage, die in dieser Arbeit nicht behandelt wird, ist, ob eine Bewegungspla- nung vollständig mit Methoden der Künstlichen Intelligenz durchgeführt werden kann. Zukünftig ist vorstellbar, dass eine KI-basierte Simulation im Cyberphysischen Zwilling zum Einsatz kommt. 6.4 Kritische Reflexion der Hypothesen 167 Die Rolle des Menschen Die Rolle des Menschen in logistischen Systemen wird in dieser Arbeit nicht betrachtet. Insbesondere der Einfluss von Mensch-Maschine-Interaktionen in der Bewegungsplanung wird nicht berücksichtigt. Die hohen Geschwindig- keiten, durch die das entwickelte Verfahren seine Leistungsfähigkeit erreicht, verhindern eine Integration von Menschen aus Sicherheitsgründen. Dem- entsprechend ist der ideale logistische Raum, wie er in dieser Arbeit definiert wurde, menschenleer. Auch die entwickelte Axiomatik nimmt keinen direk- ten Bezug auf den Menschen und kann somit als unvollständig angesehen werden. Kapitel 7 Ergebniszusammenfassung und Forschungsausblick Diese Arbeit schließt mit der Zusammenfassung ihrer Ergebnisse, d. h. ei- ner Aufführung der wichtigsten Erkenntnisse und Beiträge, die sie zum wissenschaftlichen Fortschritt in ihrem Betrachtungsbereich leistet. Der For- schungsausblick formuliert Anknüpfungspunkte für weitere Arbeiten, die sich aus ihnen ergeben. Erkenntnisse und wissenschaftlicher Beitrag Die folgenden Ergebnisse sind Bestandteil dieser Arbeit: • die erstmalige formale Definition des idealen logistischen Raums • die erstmalige Beschreibung einer Axiomatik der Logistik • die Definition des Cyberphysischen Zwillings • die erstmalige Beschreibung eines Kontinuums auf Basis des logistischen Raums mit den Extrempunkten des idealisierten Lagerwesens und des idealisierten Förderwesens • in der Folge die erstmalige Beschreibung eines Verfahrens, das die kon- fliktfreie Bewegungsplanung vieler physischer Objekte im idealen logis- tischen Raum effizient durchführt • der Nachweis, dass ein Sortiersystem auf Basis des Verfahrens leistungs- fähiger ist als ein klassisches Sortiersystem mit Stetigfördertechnik • die Beschreibung eines Versuchsfelds für die Entwicklung Cyberphysi- scher Zwillinge • die Beschreibung des Loadrunners für hochdynamische Sortieranwen- dungen in der Logistik Die Arbeit vereinigt sehr grundlegende Aspekte mit der Neudefintion der Logistik auf Basis einer Axiomatik. Aus ihr erfolgt die Bestimmung der For- schungslücke für die Materialflusssteuerung im idealen logistischen Raum, 169 170 7 Ergebniszusammenfassung und Forschungsausblick der das idealisierte Förderwesen beschreibt. Zur Schließung dieser Lücke wird ein Verfahren zur Bewegungsplanung entwickelt. Anschließend wird die Entwicklung des Loadrunners in einem Versuchsfeld auf Basis des Cy- berphysischen Zwillings beschrieben und in einer Simulationsstudie die Leistungsfähigkeit in der Paketsortierung untersucht. Forschungsausblick Die Ergebnisse dieser Arbeit bieten zahlreiche Anknüpfungspunkte für zu- künftige Forschungsarbeiten: • Weiterentwicklung der Axiomatik der Logistik unter Berücksichtigung der Themenbereiche menschliche Aktivität, Transportwesen und logisti- sches Management • Der Fokus dieser Arbeit liegt auf der kontinuierlichen Bewegungspla- nung für den idealen logistischen Raum, der einen Extrempunkt logisti- scher Räume abbildet. Denkbar ist die Entwicklung von Verfahren, die gitterbasierte Bewegungsplanung mit kontinuierlichen Ansätzen kombi- nieren und somit das gesamte Spektrum logistischer Räume abdecken. • Entwicklung von optimalen Algorithmen für die Bewegungsplanung im idealen logistischen Raum • Erweiterung des Konzepts des Cyberphysischen Zwillings um die menschliche Aktivitätserkennung und -simulation. Zusammenfassend stellen die Ergebnisse dieser Arbeit sowohl den Start- punkt für die Weiterentwicklung einer allgemeinen Logistiktheorie als auch für die Entwicklung von Transportrobotersystemen im industriellen Kontext dar. Literaturverzeichnis [Alu15] Rajeev Alur. Principles of Cyber-Physical Systems. MIT Press, 2015. ISBN: 978-0-262-02911-7. [Arn+08a] „Grundlagen: Begriff der Logistik, logistische Systeme und Prozesse“. In: Handbuch Logistik. Hrsg. von Dieter Arnold u. a. VDI-Buch. Berlin, Heidel- berg: Springer, 2008, S. 3–34. DOI: 10.1007/978-3-540-72929-7_1. [Arn+08b] „Lager- und Materialflussprozesse“. In: Handbuch Logistik. Hrsg. von Dieter Arnold u. a. VDI-Buch. Berlin, Heidelberg: Springer, 2008, S. 371–404. DOI: 10.1007/978-3-540-72929-7_8. [Ban19] Jagdish Chand Bansal. „Particle Swarm Optimization“. In: Evolutionary and Swarm Intelligence Algorithms. Hrsg. von Jagdish Chand Bansal, Pramod Kumar Singh und Nikhil R. Pal. Studies in Computational Intelligence. Cham: Springer International Publishing, 2019, S. 11–23. DOI: 10.1007/978- 3-319-91341-4_2. [Bau13] Dieter Baum. Grundlagen der Warteschlangentheorie. Masterclass. Springer Spektrum, 2013. DOI: 10.1007/978-3-642-39632-8. [BG88] Phillip J. Barry und Ronald N. Goldman. „A Recursive Evaluation Algo- rithm for a Class of Catmull-Rom Splines“. In: ACM SIGGRAPH Computer Graphics 22.4 (Juni 1988), S. 199–204. DOI: 10.1145/378456.378511. [BJ19] Christoph Beumer undDirk Jodin. „Sortier- und Verteilsysteme“. In: Innerbe- triebliche Logistik. Hrsg. von Thorsten Schmidt. Fachwissen Logistik. Berlin, Heidelberg: Springer, 2019, S. 153–173. DOI: 10.1007/978-3-662-57930-5_6. [Bod+20] Umesh Bodkhe u. a. „A Survey on Decentralized Consensus Mechanisms for Cyber Physical Systems“. In: IEEE Access 8 (2020), S. 54371–54401. DOI: 10.1109/ACCESS.2020.2981415. [But11] Giorgio C. Buttazzo. Hard Real-Time Computing Systems: Predictable Schedu- ling Algorithms and Applications. 3rd. Springer Publishing Company, Incor- porated, 2011. ISBN: 978-1-4614-0675-4. [CKV21] Brennan Cain, Michail Kalaitzakis und Nikolaos Vitzilaios. „MK-RRT*: Multi-Robot Kinodynamic RRT* Trajectory Planning“. In: 2021 International Conference on Unmanned Aircraft Systems (ICUAS). Juni 2021, S. 868–876. DOI: 10.1109/ICUAS51884.2021.9476688. [CR74] Edwin Catmull und Raphael Rom. „A Class of Local Interpolating Splines“. In: Computer Aided Geometric Design. Elsevier, 1974, S. 317–326. [Dan14] Damian Daniluk.Verteilte Simulation und Emulation vonMaterialflusssystemen mit dezentraler Steuerung. Dortmund: Verlag Praxiswissen, 2014. ISBN: 978-3- 86975-093-4. [Deu98] Deutsches Institut für Normung e. V., Hrsg. DIN 19233: Leittechnik - Prozeß- automatisierung - Automatisierung mit Prozeßrechensystemen, Begriffe. 1998. 171 172 Literaturverzeichnis [DVD20] M. De Ryck, M. Versteyhe und F. Debrouwere. „Automated Guided Vehicle Systems, State-of-the-Art Control Algorithms and Techniques“. In: Journal of Manufacturing Systems 54 (Jan. 2020), S. 152–173. DOI: 10.1016/j.jmsy.2019. 12.002. [Fle21] Flexlog. Gridsorter. 2021. URL: https://www.flexlog.de/de/gridsorter/. [FS21] Jörg Franke und Peter Schuderer. „Simulationsbasierte Untersuchung der Grenzproduktivität von Robotern in einem AutoStore-Lagersystem“. In: Simulation in Produktion und Logistik 2021: Erlangen, 15.-17. September 2021 (2021), S. 197. URL: http ://www.asim-fachtagung-spl .de/asim2021/ papers/Proof_199.pdf. [Gar19] Felipe Garcia Lopez. Predictive and Cooperative Online Motion Planning : A Contribution to Networked Mobile Robot Navigation in Industrial Applications. Stuttgart : Fraunhofer Verlag, 2019. DOI: 10.18419/opus-10715. [Gud10a] Timm Gudehus. „Aufgaben und Aspekte der Logistik“. In: Logistik: Grund- lagen - Strategien - Anwendungen. Berlin, Heidelberg: Springer, 2010, S. 3–42. DOI: 10.1007/978-3-540-89389-9_1. [Gud10b] Timm Gudehus. „Transportsysteme“. In: Logistik: Grundlagen - Strategien - Anwendungen. Berlin, Heidelberg: Springer, 2010, S. 775–873. DOI: 10.1007/ 978-3-540-89389-9_18. [Gue+14] Kevin R. Gue u. a. „GridStore: A Puzzle-Based Storage System With Decen- tralized Control“. In: IEEE Transactions on Automation Science and Engineering 11.2 (Apr. 2014), S. 429–438. DOI: 10.1109/TASE.2013.2278252. [Guy+09] Stephen. J. Guy u. a. „ClearPath: Highly Parallel Collision Avoidance for Multi-Agent Simulation“. In: Proceedings of the 2009 ACM SIGGRAPH/Euro- graphics Symposium on Computer Animation. SCA ’09. New York, NY, USA: Association for Computing Machinery, Aug. 2009, S. 177–187. DOI: 10.1145/ 1599470.1599494. [He+18] Meiling He u. a. „Logistics Space: A Literature Review from the Sustainabi- lity Perspective“. In: Sustainability 10.8 (Aug. 2018), S. 2815. DOI: 10.3390/ su10082815. [Hug+13] John Hughes u. a. Computer Graphics: Principles and Practice. 3. Edition. Up- per Saddle River, New Jersey: Addison-Wesley, Juli 2013. ISBN: 978-0-321- 39952-6. [Jt12] Dirk Jodin und Michael ten Hompel. „Einleitung“. In: Sortier- und Verteilsys- teme: Grundlagen, Aufbau, Berechnung und Realisierung. Hrsg. von Dirk Jodin und Michael ten Hompel. VDI-Buch. Berlin, Heidelberg: Springer, 2012, S. 1–23. DOI: 10.1007/978-3-642-31290-8_1. [JY94] Hsu Wen Jing und Huang Shell Ying. „Route Planning of Automated Gui- ded Vehicles“. In: Proceedings of the Intelligent Vehicles ’94 Symposium. Okt. 1994, S. 479–484. DOI: 10.1109/IVS.1994.639565. [KE95] J. Kennedy und R. Eberhart. „Particle Swarm Optimization“. In: Proceedings of ICNN’95 - International Conference on Neural Networks. Bd. 4. Nov. 1995, 1942–1948 vol.4. DOI: 10.1109/ICNN.1995.488968. [Kri+18] Werner Kritzinger u. a. „Digital Twin in Manufacturing: A Categorical Literature Review and Classification“. In: IFAC-PapersOnLine. 16th IFAC Symposium on Information Control Problems in Manufacturing INCOM 2018 51.11 (Jan. 2018), S. 1016–1022. DOI: 10.1016/j.ifacol.2018.08.474. Literaturverzeichnis 173 [Lan+18] Giesela Lanza u. a. Wandlungsfähige, menschzentrierte Strukturen in Fabri- ken und Netzwerken der Industrie 4.0 (acatech Studie). Techn. Ber. Mün- chen: Herbert Utz Verlage, 2018. URL: https : / / www . acatech . de / publikation/wandlungsfaehige-menschzentrierte-strukturen-in-fabriken- und-netzwerken-der-industrie-4-0/download-pdf/?lang=de. [LaV06] Steven M. LaValle. Planning Algorithms. Cambridge: Cambridge University Press, 2006. DOI: 10.1017/CBO9780511546877. [LSB09] Boris Lau, Christoph Sprunk und Wolfram Burgard. „Kinodynamic Motion Planning for Mobile Robots Using Splines“. In: 2009 IEEE/RSJ International Conference on Intelligent Robots and Systems. Okt. 2009, S. 2427–2433. DOI: 10.1109/IROS.2009.5354805. [Lun10] Jan Lunze. „Zielstellung und theoretische Grundlagen der Regelungstech- nik“. In: Regelungstechnik 1: Systemtheoretische Grundlagen, Analyse und Ent- wurf einschleifiger Regelungen. Hrsg. von Jan Lunze. Springer-Lehrbuch. Berlin, Heidelberg: Springer, 2010, S. 1–18. DOI: 10.1007/978-3-642-13808- 9_1. [NWW21] Livinus Obiora Nweke, Goitom K. Weldehawaryat und Stephen D. Wol- thusen. „Threat Modelling of Cyber–Physical Systems Using an Applied π-Calculus“. In: International Journal of Critical Infrastructure Protection 35 (Dez. 2021), S. 100466. DOI: 10.1016/j.ijcip.2021.100466. [NXZ20] Bach Hoai Nguyen, Bing Xue und Mengjie Zhang. „A Survey on Swarm Intelligence Approaches to Feature Selection in Data Mining“. In: Swarm and Evolutionary Computation 54 (Mai 2020), S. 100663. DOI: 10.1016/j.swevo. 2020.100663. [Nyh10] Peter Nyhuis.Wandlungsfähige Produktionssysteme. GITO mbH Verlag, 2010. ISBN: 978-3-942183-15-4. [PL11] Mike Phillips und Maxim Likhachev. „SIPP: Safe Interval Path Planning for Dynamic Environments“. In: 2011 IEEE International Conference on Robotics and Automation. Mai 2011, S. 5628–5635. DOI: 10.1109/ICRA.2011.5980306. [Que01] Boto von Querenburg.Mengentheoretische Topologie. Springer-Lehrbuch. Ber- lin Heidelberg: Springer, 2001. ISBN: 978-3-540-67790-1. [Rey87] Craig W. Reynolds. „Flocks, Herds and Schools: A Distributed Behavioral Model“. In: Proceedings of the 14th Annual Conference on Computer Graphics and Interactive Techniques. SIGGRAPH ’87. New York, NY, USA: Association for Computing Machinery, Aug. 1987, S. 25–34. DOI: 10.1145/37401.37406. [Roe+12] Christoph Roesmann u. a. „Trajectory Modification Considering Dynamic Constraints of Autonomous Robots“. In: ROBOTIK 2012; 7th German Con- ference on Robotics. Mai 2012, S. 1–6. URL: https://ieeexplore. ieee.org/ document/6309484. [Sch+17] Günther Schuh u. a. Industrie 4.0 Maturity Index – Die digitale Transformation von Unternehmen gestalten (acatech Studie). Techn. Ber. München: Herbert Utz Verlage, 2017. URL: https://www.acatech.de/publikation/industrie- 4 - 0 -maturity - index - die - digitale - transformation - von - unternehmen - gestalten/download-pdf?lang=de. [Sch+20] Kira Schmeltzpfenning u. a. WMS Marktreport Kompakt 2020. Trends und Entwicklungen auf dem Markt für Warehouse Management Systeme. Mün- chen: Fraunhofer-Gesellschaft, 2020. URL: http://publica.fraunhofer.de/ dokumente/N-621775.html. 174 Literaturverzeichnis [Sei16] Zäzilia Seibold. Logical Time for Decentralized Control of Material Handling Systems. KIT Scientific Publishing, Nov. 2016. ISBN: 978-3-7315-0567-9. [Sem15] Kai Semrau. Leistungsermittlung und Layoutgestaltung von Stückgutsortiersys- temen. Dortmund: Verlag Praxiswissen, 2015. ISBN: 978-3-86975-111-5. [SF20] Zäzilia Seibold und Kai Furmans. „Plug&Play-Fördertechnik in der Indus- trie 4.0“. In: Handbuch Industrie 4.0: Band 3: Logistik. Hrsg. von Michael ten Hompel, Thomas Bauernhansl und Birgit Vogel-Heuser. Berlin, Heidelberg: Springer, 2020, S. 81–97. DOI: 10.1007/978-3-662-58530-6_2. [Sha+15] Guni Sharon u. a. „Conflict-Based Search for Optimal Multi-Agent Pathfin- ding“. In: Artificial Intelligence 219 (Feb. 2015), S. 40–66. DOI: 10.1016/j.artint. 2014.11.006. [SK90] Horst Strunz und Karl Kurbel. Handbuch Wirtschaftsinformatik. Poeschel, 1990. ISBN: 3-7910-0499-9. [Spr08] Christoph Sprunk. Planning Motion Trajectories for Mobile Robots Using Spli- nes. 2008. URL: http://www2.informatik.uni-freiburg.de/~lau/students/ Sprunk2008.pdf. [SS20] Oren Salzman und Roni Stern. „Research Challenges and Opportunities in Multi-Agent Path Finding andMulti-Agent Pickup and Delivery Problems“. In: Proceedings of the 19th International Conference on Autonomous Agents and MultiAgent Systems. AAMAS ’20. Richland, SC, Mai 2020, S. 1711–1715. URL: http://www.orensalzman.com/docs/AAMAS20.pdf. [Ste15] James Stewart. Calculus: Early Transcendentals. 8. Edition. Boston, MA, USA: Cengage Learning, Feb. 2015. ISBN: 978-1-285-74155-0. [Sun+20] Weifeng Sun u. a. „A Survey of Using Swarm Intelligence Algorithms in IoT“. In: Sensors 20.5 (Jan. 2020), S. 1420. DOI: 10.3390/s20051420. [ten+20] Michael ten Hompel u. a. „Technical Report: LoadRunner©R , a New Plat- form Approach on Collaborative Logistics Services“. In: Logistics Journal : nicht referierte Veröffentlichungen 2020.10 (Okt. 2020). DOI: 10 . 2195/ lj _ NotRev_tenhompel_en_202010_01. [tK15] Michael ten Hompel und Sören Kerner. „Logistik 4.0“. In: Informatik- Spektrum 38.3 (Juni 2015), S. 176–182. DOI: 10.1007/s00287-015-0876-y. [tSB11] Michael ten Hompel, Volker Sadowsky und Maria Beck. „Leistungsermitt- lung von Kommissioniersystemen“. In: Kommissionierung: Materialflusssyste- me 2 - Planung und Berechnung der Kommissionierung in der Logistik. VDI-Buch. Berlin, Heidelberg: Springer, 2011, S. 127–205. DOI: 10.1007/978-3-540-29940- 0_7. [tSD18] Michael ten Hompel, Thorsten Schmidt und Johannes Dregger. „Verpa- ckungssysteme“. In:Materialflusssysteme: Förder- und Lagertechnik. VDI-Buch. Berlin, Heidelberg: Springer, 2018, S. 5–50. DOI: 10.1007/978-3-662-56181- 2_2. [Ulu14] Onur Uludag. „GridPick: A High Density Puzzle Based Order Picking System with Decentralized Control“. Diss. Auburn University, Jan. 2014. URL: https://etd.auburn.edu//handle/10415/3984. [van+11a] Jur van den Berg u. a. „Reciprocal Collision Avoidance with Acceleration- Velocity Obstacles“. In: 2011 IEEE International Conference on Robotics and Automation. Mai 2011, S. 3475–3482. DOI: 10.1109/ICRA.2011.5980408. Literaturverzeichnis 175 [van+11b] Jur van den Berg u. a. „Reciprocal N-Body Collision Avoidance“. In: Robotics Research. Hrsg. von Cédric Pradalier, Roland Siegwart und Gerhard Hir- zinger. Springer Tracts in Advanced Robotics. Berlin, Heidelberg: Springer, 2011, S. 3–19. DOI: 10.1007/978-3-642-19457-3_1. [Ver10] Verein Deutscher Ingenieure. VDI-Richtlinie 3633 Blatt 1: Simulation von Logistik-, Materialfluss- und Produktionssystemen, Grundlagen (Gründdruck). 2010. [Ver83] Verein Deutscher Ingenieure. VDI-Richtlinie 3619: Sortiersysteme für Stückgut. 1983. [Ver94] Verband Deutscher Maschinen- und Anlagenbau e. V. (VDMA). VDMA- Einheitsblatt 15276: Datenschnittstellen in Materialflusssystemen. 1994. [vLM08] Jur van den Berg, Ming Lin und Dinesh Manocha. „Reciprocal Velocity Obstacles for Real-Time Multi-Agent Navigation“. In: 2008 IEEE Interna- tional Conference on Robotics and Automation. Mai 2008, S. 1928–1935. DOI: 10.1109/ROBOT.2008.4543489. [WDM08] Peter R. Wurman, Raffaello D’Andrea und Mick Mountz. „Coordinating Hundreds of Cooperative, Autonomous Vehicles in Warehouses“. In: AI Magazine 29.1 (März 2008), S. 9. DOI: 10.1609/aimag.v29i1.2082. [Wen18] Sigrid Wenzel. „Simulation logistischer Systeme“. In:Modellierung logisti- scher Systeme. Hrsg. von Horst Tempelmeier. Fachwissen Logistik. Berlin, Heidelberg: Springer, 2018, S. 1–34. DOI: 10.1007/978-3-662-57771-4_1. [Wur17] Christian Wurll. „Das bewegliche Lager auf Basis eines Cyber-physischen Systems“. In: Handbuch Industrie 4.0 Bd.3: Logistik. Hrsg. von Birgit Vogel- Heuser, Thomas Bauernhansl und Michael ten Hompel. Springer Reference Technik. Berlin, Heidelberg: Springer, 2017, S. 151–177. DOI: 10.1007/978-3- 662-53251-5_12. [Yan+17] Feng Yang u. a. „Survey of Swarm Intelligence Optimization Algorithms“. In: 2017 IEEE International Conference on Unmanned Systems (ICUS). Okt. 2017, S. 544–549. DOI: 10.1109/ICUS.2017.8278405. [YSK09] Cem Yuksel, Scott Schaefer und John Keyser. „On the Parameterization of Catmull-Rom Curves“. In: 2009 SIAM/ACM Joint Conference on Geometric and Physical Modeling. SPM ’09. New York, NY, USA: Association for Computing Machinery, Okt. 2009, S. 47–53. DOI: 10.1145/1629255.1629262. [Zei+17] Felix Zeidler u. a. „Referenzfeld zur Erforschung und Entwicklung neuar- tiger hybrider Formen der Zusammenarbeit von Menschen und Maschi- nen in der Logistik“. In: Logistics Journal : Proceedings 2017.10 (2017). DOI: 10.2195/lj_Proc_zeidler_de_201710_01.