Datenqualität messen – „fitness for use“

Datenqualität messen – „fitness for use“

Von | 29. April 2014

Wenn es darum geht die Datenqualität von Artikelstammdaten zu messen, ist grundsätzlich der Datennutzer in den Fokus der Betrachtung zu rücken. Dass Datenqualität am besten vom Datenkonsumenten beurteilt und bewertet werden kann, haben bereits die Wissenschaftler Strong und Wang, die als Urväter der Datenqualitätsforschung zu bezeichnen sind, mit den Worten „fitness for use“ umschrieben.  Sie haben gleichzeitig mehrere Datenqualitätsdimensionen spezifiziert, mit dessen Hilfe die Datenqualität messbar wird und begründeten so einen mehrdimensionalen Ansatz (Strong, Diane M.; Wang, Richard Y. [1996]: Beyond Accuracy: What Data Quality Means to Data Consumers, in: Journal of Management Information Systems 12 [4, Spring], S. 5-34).

Im deutschsprachigen Raum wurde das Wangsche Framework von der Deutschen Gesellschaft für Informations- und Datenqualität e.V. (DGIQ e.V.)  adaptiert und verfeinert. So können Datendefekte heute mit Hilfe von 15 Datenqualitätsdimensionen (z.B. Aktualität, Zugänglichkeit, Vollständigkeit, Übersichtlichkeit, Wertschöpfung) in vier Kategorien (System, Nutzung, Inhalt und Darstellung) gemessen werden (Rohweder, Jan Philipp; Kasten, Gerhard; Malzahn, Dirk, Piro, Anderea; Schmid, Joachim [2011]: Informationsqualität: Definitionen, Dimmensionen und Begriffe, in: Hildebrand, Knut [Hrsg.], Daten- und Informationsqualität:  Auf dem Weg zur Information Excellence, Wiesbaden, Vieweg + Teubner, 2., aktualisierte und erweiterte Auflage, S. 25-45). Allerdings, so hat die Praxis gezeigt, ist es wenig sinnvoll immer alle Dimensionen zur Messung heranzuziehen. Vielmehr kommt es darauf an, aus dem Set der Datenqualitätsfacetten die auszuwählen, die für den Datennutzer und damit für die Zielgruppe der Daten tatsächlich relevant sind. Womit sich der Kreis an dieser Stelle wieder schließt: „fitness for use“.

Im Rahmen meiner Fallstudienanalyse „Qualitätsorientiertes Artikelstammdatenmanagement und deren wirtschaftlichen Effekte auf die Prozesskette aus Sicht eines globalen Artikelstamm-datenpools“ werden daher nur solche Datenqualitätsmerkmale bzw. -dimensionen betrachtet, die für den multilateralen und wertschöpfungsübergreifenden Artikelstammdatenaustausch über das GDS-Netzwerk von zentraler Bedeutung sind:

Hinweis: Die hier allgemein gehaltenen Definitionen entsprechen teilweise den Definitionen der DGIQ e.V. bzw. der oben erwähnten Fachpublikationen.

Korrektheit: Artikelstammdaten gelten als fehlerfrei und korrekt, wenn sie mit der Realität (z.B. mit den Informationen auf oder am Produkt) übereinstimmen.

Konsistenz: Artikelstammdaten eines oder mehrerer Datensätzen gelten als konsistent, wenn die zugeordneten Datenwerte bestimmter Attribute in einer widerspruchsfreien Beziehungen zum Schlüsselattribut, der Global Trade Item Number (GTIN), stehen.

Standardkonformität: Artikelstammdaten eines Artikels sind standardkonform bzw. eindeutig auslegbar, d.h. die Daten können durch die Nutzer in stets gleicher und fachlich richtiger Art und Weise verstanden werden, wenn die Einhaltung GDSN spezifischer GS1-Standards gewährleistet ist.

Vollständigkeit: Informationen sind vollständig, wenn sie nicht fehlen und zu den festgelegten Zeitpunkten in den jeweiligen Prozess-Schritten zur Verfügung stehen.

Aktualität: Artikelstammdaten sind aktuell, wenn sie die tatsächliche Eigenschaft des beschriebenen Objektes zeitnah abbilden und den Datennutzer zeitgerecht zur Verfügung stehen.

Vertrauenswürdigkeit: Artikelstammdaten eines Artikels gelten, als vertrauenswürdig, wenn die Daten als glaubwürdig gelten und sie darüber hinaus über eine hohes Ansehen verfügen.

Zugänglichkeit: Daten sind zugänglich, wenn sie anhand einfacher Verfahren und auf direktem Weg für den Anwender abrufbar sind.

Bei der Betrachtung der unterschiedlichen Dimensionen wird deutlich, dass sich einige der Dimensionen über einfache mathematische Verfahren messen lassen (z.B. die Vollständigkeit der Attribute über einfaches Zählen der Datenbankeinträge) und für andere, wie etwa die Facette der Vertrauenswürdigkeit, sind qualitative Nutzerbefragungen zur Messung notwendig. Allerdings ist die eigentliche Messung nicht immer ganz trivial und bedarf einer guten Vorbereitung und Evaluation. Mit der Teilnahme an der kostenlosen Fallstudie kann die Messung ohne größere Investitionsmittel leicht im Unternehmen initiiert werden.

Wenn Sie als Lieferant am Artikelstammdatenpool der 1Worldsync GmbH angebunden sind und Sie sich fragen, wie die Artikelstammdatenqualität in meinem Unternehmen aussieht und wie ich diese am Besten mit Hilfe der oben aufgezählten Datenqualitätsdimensionen messen kann, sind Sie zur Teilnahme an der Studie im Rahmen der Dissertation eingeladen.

Setzten Sie sich hierzu einfach mit mir über skasper@1worldsync.com in Verbindung.