Die Data Lineage informiert über den Zeitpunkt der Erstellung sowie über den aktuellen Status eines Datensatzes. Das ist insbesondere für Unternehmen mit vertraulichen Datenbeständen nützlich. Im Folgenden betrachten wir die Data Lineage im Einzelnen, um Ihnen ein besseres Verständnis dafür zu vermitteln.

Was ist Data Lineage?

Data Lineage, auch Datenherkunft oder Datenabstammung genannt, bezeichnet die protokollierten Änderungen, Anpassungen und Entwicklungen von spezifischen Datensätzen. So bietet sie einen Überblick über die Entstehung eines Datensatzes, dessen Weiterentwicklung und Veränderungen, seinen Bestimmungsort und seine Eigenschaften. Auf eine Person bezogen, könnte man es als biologische Uhr bezeichnen. Es ist vergleichbar mit einer Krankenakte für einen Datensatz.

Als Beispiel könnte man einen Baumstumpf heranziehen. Wird ein Baum gefällt, kann man die Ringe am Stumpf untersuchen, um das ungefähre Alter des Baumes zu bestimmen. Genauso verhält sich mit der Data Lineage hinsichtlich Dateien. Sie gibt Aufschluss darüber, wann und von wem sie erstellt wurden.

Vorteile

Durch Einbeziehen der Datenherkunft kann sich in Unternehmen mehr Transparenz geschaffen werden. Das wiederum sorgt für ein besseres Verständnis für die Geschichte eines Datensatzes, von seiner Entstehung bis zu seinem aktuellen Status. Denn die Datenherkunft gewährleistet die Qualität der Daten. Ohne Datenabstammung vermindert sich die Datenqualität im Zuge von Weiterentwicklungen, Verlagerungen und Umwandlungen.

Digitale Darstellung einer DNA-Sequenz.
Data Lineage liefert Unternehmen transparente Informationen.

Über die Data Lineage kann ein Unternehmen die Einhaltung bestimmter gesetzlicher Vorschriften und Normen gewährleisten. Gleichermaßen können unvollständige Daten für Unterbrechungen im Arbeitsablauf sorgen. Aus diesem Grund gewährleistet die vollständige Erfassung eines Datensatzes seine Integrität und Klarheit. In vielen Unternehmen sind die Mitglieder auf vollständige Datensätze angewiesen, um sie für wichtige Berichte zu verwenden. Dazu benötigen sie Data Lineage Tools, mit denen sich bestätigen lässt, dass die in den Berichten enthaltenen Informationen korrekt sind.

Visualisierungen und Data Lineage

Visuelle Darstellungen von Daten können für mehr Klarheit sorgen und bei Teammitgliedern, die Vorbehalte gegen die Verwendung von Daten haben, mehr Vertrauen schaffen. Der Datenfluss und die Datenherkunft innerhalb von Unternehmen ist oft komplex und undurchsichtig. Darum ist eine visuelle Darstellung des Datenflusses die beste Methode, um den Mitgliedern die Vorgänge zu verdeutlichen.

Mit einer visuellen Darstellung des innerbetrieblichen Datenflusses ist eine Zuordnung der Informationen von ihrer Entstehung bis zum aktuellen Stand möglich. Zudem stellt sie auch die Entwicklungen dar, die die Daten auf ihrem Weg durchmachen.

Abbildung einer Person, die aus digitalen Informationen besteht.
Grafiken zur Datenherkunft unterstützen Teams bei der richtigen Verwertung von Informationen.

Ein Diagramm ist eine überzeugende Möglichkeit, Data Lineage für Ihre Mitarbeiter verständlich abzubilden. Deshalb sollte eine Grafiksoftware in der Lage sein, ein grundlegendes visuelles Mapping zu erstellen und außerdem Möglichkeiten zur Datensuche bieten. In jedem Graphen sind Teile des Datenpuzzles enthalten, zu denen die Benutzer Fragen und Bedenken haben könnten. Die Suchfunktionen sorgen hier für Klarheit, da sie bestimmte Informationen innerhalb des Diagramms lokalisieren können.

Metadaten-Management und Data Lineage

Das Metadaten-Management strukturiert Informationen über Daten, so dass sie durchsuchbar sind. Die präzisen Aufzeichnungen über den Datenverkehr werden dadurch bereichert und gepflegt. Mit der richtigen Lösung zur Metadaten-Verwaltung wird sichergestellt, dass die Datenherkunft innerhalb eines Unternehmens gut nachvollziehbar ist. Im Laufe eines typischen Datenflusses werden Metadaten zusammen mit den Änderungen an den jeweiligen Datensätzen auf ihrem Weg zum Ziel gespeichert.

Der Kopf eines Menschen, der aus digitalen Punkten besteht.
Metadaten sind integraler Bestandteil der Data Lineage.

Mit einer Metadaten-Managementsoftware wird eine umfassende Pflege der Datenabstammung für unterschiedliche Abteilungen in einem Unternehmen über eine abgestimmte Schnittstelle ermöglicht. Durch die Darstellung von Datenherkunftsberichten steigern Teams ihre Effizienz und Kompetenz. Darüber hinaus sorgt das Metadaten-Management dafür, dass diese Berichte detailliert und strukturiert gehalten werden.

Data Lineage bietet einen detaillierten Einblick in den Lebenszyklus eines Datensatzes. Indem man Kenntnis über die verschiedenen Einflussgrößen gewinnt, schafft man eine echte organisatorische Transparenz. Kombinieren Sie wertvolle Informationen mit einer effektiven Datenherkunft, um alle Beteiligten auf dem aktuellsten Stand zu halten.

Casey Schmidt – Content Manager and Industry Expert | Canto

Casey Schmidt ist Content Manager bei Canto und interessiert sich dafür, komplexe Themen zu erfassen und für unsere Leser leicht verständlich zu machen.