Q57. Fallstudie 1 - Flusslogistik
Überblick über das Unternehmen
Flowlogistic ist ein führender Logistik- und Lieferkettenanbieter. Das Unternehmen unterstützt Unternehmen auf der ganzen Welt bei der Verwaltung ihrer Ressourcen und deren Beförderung an den Bestimmungsort. Das Unternehmen ist schnell gewachsen und hat sein Angebot auf den Schienen-, LKW-, Flugzeug- und Seeverkehr ausgeweitet.
Hintergrund des Unternehmens
Das Unternehmen begann als regionales Speditionsunternehmen und expandierte dann in andere Logistikmärkte.
Da sie ihre Infrastruktur nicht aktualisiert haben, ist die Verwaltung und Verfolgung von Aufträgen und Sendungen zu einem Engpass geworden. Um die Abläufe zu verbessern, entwickelte Flowlogistic eine eigene Technologie zur Verfolgung von Sendungen in Echtzeit auf Paketebene. Das Unternehmen ist jedoch nicht in der Lage, diese Technologie einzusetzen, da sein auf Apache Kafka basierendes Technologiepaket das Verarbeitungsvolumen nicht bewältigen kann. Darüber hinaus möchte Flowlogistic seine Aufträge und Sendungen weiter analysieren, um festzustellen, wie sie ihre Ressourcen am besten einsetzen können.
Lösungskonzept
Flowlogistic möchte zwei Konzepte in der Cloud umsetzen:
* Nutzung der firmeneigenen Technologie in einem Echtzeit-Bestandsverfolgungssystem, das den Standort der Ladungen anzeigt
* Alle Aufträge und Versandprotokolle, die sowohl strukturierte als auch unstrukturierte Daten enthalten, sollen analysiert werden, um zu ermitteln, wie die Ressourcen am besten eingesetzt werden können und welche Märkte ausgebaut werden sollen. Sie wollen auch prädiktive Analysen nutzen, um früher zu erfahren, wann sich eine Lieferung verzögert.
Bestehendes technisches Umfeld
Die Flowlogistic-Architektur befindet sich in einem einzigen Rechenzentrum:
* Datenbanken
8 physische Server in 2 Clustern
- SQL Server - Benutzerdaten, Inventar, statische Daten
3 physische Server
- Cassandra - Metadaten, Verfolgung von Nachrichten
10 Kafka-Server - Verfolgung der Nachrichtenaggregation und Batch-Insert
* Anwendungsserver - Kunden-Frontend, Middleware für Bestellung/Kunden
60 virtuelle Maschinen auf 20 physischen Servern
- Tomcat - Java-Dienste
- Nginx - statischer Inhalt
- Batch-Server
* Speichergeräte
- iSCSI für Hosts virtueller Maschinen (VM)
- Fibre Channel Storage Area Network (FC SAN) - SQL-Server-Speicher
- Netzwerkspeicher (NAS) zur Speicherung von Bildern, Protokollen und Sicherungen
* 10 Apache Hadoop/Spark-Server
- Kern-Datensee
- Arbeitsbelastung durch Datenanalyse
* 20 verschiedene Server
- Jenkins, Überwachung, Bastion-Hosts,
Geschäftliche Anforderungen
* Aufbau einer zuverlässigen und reproduzierbaren Umgebung mit skaliertem Produktionsumfang.
* Aggregieren von Daten in einem zentralisierten Data Lake zur Analyse
* Nutzung historischer Daten zur Durchführung von Prognosen für künftige Sendungen
* Genaue Nachverfolgung jeder Sendung weltweit mit firmeneigener Technologie
* Verbesserung der geschäftlichen Flexibilität und der Innovationsgeschwindigkeit durch rasche Bereitstellung neuer Ressourcen
* Analysieren und Optimieren der Architektur für die Leistung in der Cloud
* Vollständige Umstellung auf die Cloud, wenn alle anderen Anforderungen erfüllt sind
Technische Anforderungen
* Verarbeitung von Streaming- und Batch-Daten
* Migration bestehender Hadoop-Workloads
* Sicherstellen, dass die Architektur skalierbar und elastisch ist, um den sich ändernden Anforderungen des Unternehmens gerecht zu werden.
* Nutzung verwalteter Dienste, wann immer möglich
* Verschlüsselung der Daten während des Flugs und im Ruhezustand
* SEO Statement Wir sind so schnell gewachsen, dass unsere Unfähigkeit, unsere Infrastruktur zu aktualisieren, unser weiteres Wachstum und unsere Effizienz wirklich behindert. Wir sind effizient beim Transport von Sendungen um die Welt, aber wir sind ineffizient beim Transport von Daten.
Wir müssen unsere Informationen so organisieren, dass wir leichter verstehen können, wo unsere Kunden sind und was sie versenden.
CTO-Erklärung
Die IT hat für uns nie Priorität gehabt, und so haben wir mit dem Wachstum unserer Daten nicht genug in unsere Technologie investiert. Ich habe gute Mitarbeiter, die die IT-Abteilung leiten, aber sie sind so sehr mit der Verwaltung unserer Infrastruktur beschäftigt, dass ich sie nicht dazu bringen kann, sich um die wirklich wichtigen Dinge zu kümmern, z. B. die Organisation unserer Daten, die Erstellung von Analysen und die Implementierung der Tracking-Technologie des CFO.
CFO-Erklärung
Ein Teil unseres Wettbewerbsvorteils besteht darin, dass wir uns selbst für verspätete Sendungen und Lieferungen bestrafen. Wenn wir jederzeit wissen, wo sich unsere Sendungen befinden, hat das einen direkten Einfluss auf unser Endergebnis und unsere Rentabilität. Außerdem möchte ich kein Kapital für den Aufbau einer Serverumgebung binden.
Flowlogistic führt sein Echtzeit-Bestandsverfolgungssystem ein. Die Tracking-Geräte werden alle Nachrichten zur Paketverfolgung senden, die nun an ein einziges Google Cloud Pub/Sub-Thema anstelle des Apache Kafka-Clusters gehen. Eine Abonnentenanwendung verarbeitet dann die Nachrichten für Echtzeitberichte und speichert sie in Google BigQuery für historische Analysen. Sie möchten sicherstellen, dass die Paketdaten im Laufe der Zeit analysiert werden können.
Welchen Ansatz sollten Sie wählen?