Datenqualität und Qualität

Grundlage einer guten Arbeit sind gute Daten. Was nach einer einfachen und platten Weisheit klingt, ist in der Realität manchmal gar nicht so ohne weiteres umzusetzen.
Wann sind Daten gut, wann sind sie schlecht? Wovon hängt das ab? Hat das was mit Qualität zu tun? Was ist Qualität?
Im Rahmen meiner Masterarbeit arbeite ich mit verschiedenen Daten aus unterschiedlichen Quellen. Open data wie CORINE Land Cover und open street map gehören genauso dazu wie behördliche Datensätze. Diese Datensätze gilt es, im Vorfeld hinsichtlich ihrer Qualität zu analysieren, um daraus Rückschlüsse auf die Nutzbarkeit der Informationen ziehen zu können. Das ist ein ganz normaler Vorgang bei der Arbeit mit Daten und Informationen; die Einschätzung der Güte (also Qualität) ist von hoher Bedeutung. Aber was ist nun Qualität, was bezeichnet sie genau? Nach DIN ISO 8402 versteht man unter Qualität

„die Gesamtheit von Merkmalen einer Einheit bezüglich Ihrer Eignung, festgelegte und vorausgesetzte Erfordernisse zu erfüllen“.

Aha, Qualität ist also anwendungsbezogen, immer auf einen bestimmten Einsatzzweck hin ausgerichtet. Sind sie für einen Zweck qualitativ ausreichend, müssen sie das für eine andere Aufgabe nicht unbedingt sein. Überdies ist der Begriff Qualität breit auslegbar. Daher habe ich im Vorfeld der Datenanalyse eine genauere und für die Zwecke meiner Arbeit sinnvolle und relevante Bezeichnung von Qualitätsmerkmalen festgelegt. Ich habe fünf Qualitätsmerkmale erstellt, an Hand derer ich die Qualität meiner Daten kategorisieren möchte.

a) Aktualität
b) Genauigkeit
c) Konsistenz
d) Richtigkeit
e) Vollständigkeit

Die Aktualität beschreibt die zeitliche Gültigkeit der Geodaten und kann zum Beispiel über ein Erfassungsdatum spezifiziert werden.
Der Begriff Genauigkeit ist unterschiedlich auslegbar. Zum einen bezieht er sich auf die räumliche Lage der Geodaten (Lagegenauigkeit absolut zu einem übergeordneten Koordinatensystem oder relativ zu anderen Objekten), zum anderen kann er die thematische Genauigkeit bezeichnen. Darunter versteht man die Detailtiefe der Sachinformationen, z. B. die Anzahl der Klasseneinteilungen einer Landnutzungskartierung.

Unter Konsistenz versteht man die logische Richtigkeit der Geodaten. Hierunter fällt unter anderem die Topologie, aber auch z. B. die gleiche Aktualität verschiedener Objekte innerhalb eines Datensatzes.

Der Begriff Richtigkeit ist im Sinn von fehlerfrei zu verstehen und ein Datensatz ist qualitativ vollständig, wenn die Daten komplett für ein Gebiet vorliegen und alle Sachinformationen befüllt sind.

Diese fünf Qualitätskriterien werden im Rahmen meiner Masterarbeit angehalten und sind gemeint, wenn es um die Beurteilung von Datensätzen und Informationen geht.

Hinterlasse einen Kommentar