Data-Warehouse

 

Ein Data Warehouse (zu) deutsch in etwas "Datenlager" ist eine Datenbank, welche für Analysen optimiert wurde.

Das Ziel ist die Zusammenführung und Aufbereitung von Daten unterschiedlicher Formate und aus verschiedenen Quellen, um einen umfassenden und strukturierten Blick auf die vorliegenden Informationen zu erhalten.


Die Funktionsweise

Der dafür nötige Prozess lässt sich in mehrere Schritte gliedern:
- Datenbeschaffung/-integration zum Abruf aus verschiedenen Quellen sowie zur Anpassung (z. B. einheitliches Format) und Ablage am Zielort
- Datenhaltung zur langfristigen Speicherung
- Datenauswertung, um eine nach bestimmten Kriterien ablaufende Analyse zu gewährleisten
- Datenbereitstellung, also die Datenhaltung benötigter spezieller Teile der Datenbestände (nicht Jeder braucht Alles) zur weiteren Verwendung durch Mitarbeiter


Der ETL-Prozess

Die Datenbeschaffung und -integration lässt sich auch als ETL-Prozess zusammenfassen. Diese Abkürzung steht für "Extract - Transform - Load" und führt von der Extraktion von Daten (dem Durchforsten der Quellen und der Datenübernahme aus z.B. einem ERP-System oder externen Systemen) über die Transformation in die Schemata und Formate der Zieldatenbank bis zum Hochladen ins Zielsystem.

Was früher die technischen Ressourcen noch stark belastete und daher nur in bestimmten Abständen geschah, ist durch die Weiterentwicklungen in der Datenübertragung inzwischen oft in Echtzeit möglich.


Der Nutzen

Wo immer große Datenmengen bewegt, analysiert und geteilt / strukturiert bereitgestellt werden müssen, lässt sich ein Data Warehouse sehr gut einsetzen. Dabei kommen viele verschiedene Zwecke in Betracht wie z. B. die Aufbereitung für Statistik, Reporting und Kennzahlen, Vorbereitung z. B. für Data Mining (wodurch später Muster und Zusammenhänge erkennbar werden), Transparenz im betriebswirtschaftlichen Zeitablauf (Geschäftsprozesse, Ressourceneinsatz, Kosten) oder um Informationen über Geschäftsobjekte zusammenzustellen. Ebenso können diese Daten zur fortschreitenden Digitalisierung in der Produktion verwendet werden.

 

25.11.2020 / SL