Otto ist ein Vorreiter in Sachen Digitalisierung. Das einstige Versandhaus ist heute der größte Onlineshop für Home & Living und entwickelt sein Geschäft zur Plattform weiter. Die schiere Menge an Daten stellt den Händler allerdings immer wieder vor Herausforderungen. Wie diese gelöst werden und wie sich Otto für das weitere Wachstum wappnet, erklären die Gastautoren Andreas Bonet (Otto) und Mathias Golombek (Exasol).
Heute ist das einstige Versandhaus der größte Onlineshop für Home & Living und entwickelt sein Geschäftsmodell zur Plattform weiter. Rund 3 Millionen Markenartikel von mehr als 6.800 Marken und Partnern werden angeboten - Tendenz steigend.
Datengetriebenes Unternehmen
Otto entwickelt sich zu einem datengetriebenen Unternehmen. Daher sind Business-Intelligence (BI)-Leistungen wie Daten, Analytics, Machine Learning und AI-Fähigkeiten entscheidende Pfeiler der Strategie des Unternehmens.
Die schiere Menge an Daten stellte die Datenexperten bei Otto allerdings immer wieder vor Herausforderungen, denn zum einen hat die steigende Produkt- und Kundenzahl eine Zunahme der Datenpunkte zur Folge. Außerdem wuchs der Bedarf an Speicherplatz und Wartung.
Beschleunigte Datenanalysen
Otto brauchte eine Lösung hinter seinem Data Warehouse, die die BI-Anwendungen, wie beispielsweise Reporting-Tools und Prognosen, stabil und schnell mit Daten versorgt. Um hier eine Antwort zu finden, beauftragte Otto Exasol mit einem Proof of Concept (PoC).Ziel war es, Datenanalysen und Reports auf Basis der vorhandenen Infrastruktur zu beschleunigen - bei einem gleichzeitig enormen Zuwachs der Datenmenge. Im Verlauf des PoCs tauchte eine neue Herausforderung auf: Status quo zu diesem Zeitpunkt war, dass die Exasol-Technologie als Access Layer, also als die Oberfläche, auf der die Datenpakete an die Endgeräte ausgespielt werden, Daten aus zwei verschiedenen Quellen bezog.
Alles aus einer Hand
Das zog nicht nur eine aufwändige Harmonisierung der Datenstrukturen dieser beiden Quellen bzw. Systeme nach sich. Die doppelte Datenhaltung verschlang auch enorme Ressourcen und sorgte für eine hohe Komplexität der Ladestrecke.Die Lösung: Auf Basis der von Exasol eingesetzten In-Memory-Technologie sollte die Software nicht nur als Access Layer, sondern auch als Data Warehouse, also als eine für Analysezwecke eingesetzte zentrale Darenbank - oder, wörtlich: als Datenlager - fungieren.
Sowohl die Sammlung und Sicherung als auch die Analyse der bei Otto eingehenden Daten fanden so in nur einem System statt.

Access Layer plus Information Stack
In den folgenden Monaten wurde Exasol als Data Warehouse und Datenbasis für das Reporting-Tool Tableau installiert, das die analysierten Daten visuell für die Nutzer aufbereitet.Das bestehende Software Framework Hadoop blieb als Rohdatenspeicher weiter erhalten, denn die Technologie eignete sich hervorragend für Data-Science-Aktivitäten und die Entwickler nutzten sie intensiv.
Die In-Memory-Technologie sorgt bei der Verarbeitung der Daten dafür, dass die Datenbank äußerst performant arbeitet, denn benötigte Daten werden persistent direkt im Hauptspeicher - und nicht wie bei traditionellen Datenbanksystemen auf der Festplatte - abgelegt und verarbeitet.
Datensilos beseitigt
Zugriffe, auch durch eine große Anzahl von Nutzern, können so wesentlich schneller erfolgen. Bei Bedarf können Tausende Nutzer gleichzeitig auf die Daten zugreifen, ohne dass der Abfrage-Durchsatz leidet. So können beispielsweise sowohl die Mitarbeiter im Marketing als auch im Einkauf und im Controlling zeitgleich und ohne Verzögerungen auf Daten zu Werbeaktionen zugreifen, erhalten so in kürzester Zeit die für sie relevanten Informationen und können entsprechend auf Entwicklungen reagieren.Bei der Implementierung und Entwicklung der passenden Lösung arbeiteten Otto und Exasol, z.B. auch bei Security-Themen, eng zusammen. In einem gemeinsam veranstalteten Hackathon wurde zudem ein Spark Connector umgesetzt.
Der Connector unterstützt eine Integration zwischen Exasol und Apache Spark. Er ermöglicht das Erstellen von Spark DataFrame aus Exasol-Abfragen und das Speichern von Spark DataFrame als Exasol-Tabelle.
Noch mehr Skalierbarkeit
Der Einsatz der Exasol-Technologie soll künftig bei Otto dafür sorgen, Datensilos zu beseitigen. So sollen die Fachabteilungen nicht nur stärker eingebunden und in der Lage sein, Informationen nach ihrem Bedarf aus dem Data Warehouse ziehen und analysieren zu können.Ihnen werden neben den angeforderten Reports künftig auch Graphical User Interfaces (GUIs) zur Verfügung gestellt, über die sie selbst auf die Daten zugreifen können. So sollen Kampagnen besser abgestimmt, die Datendemokratisierung gestärkt und die Customer Journey weiter verbessert werden.
Die BI-Infrastruktur von Otto migriert ab sofort in die Cloud, um das dargestellte Wachstum von Otto sicherzustellen.