Es existieren verschiedene Arten von Daten, die als unterschiedlichen Zwecken zuträglich gelten können: zwischen Sensordaten, Verhaltensdaten und personenbezogenen Daten gibt es selbstredend bisweilen große Unterschiede. So liegt nicht nur der Erhebung solcher Informationen eine differente Praxis zugrunde, auch ist ihr jeweils antizipierter Zweck häufig ein gänzlich anderer.
Was sind Daten?
Das Wort Datum ist lateinisch und bedeutet wortwörtlich „gegeben“. Es handelt sich bei Daten also um Gegebenheiten, bzw. um deren aufgezeichnete Repräsentation. Daten unterscheiden sich maßgeblich von Fakten, durch ihre (relative) Kontextlosigkeit, also dadurch, dass sie sich lediglich anschicken, möglichst wertfrei auf einen äußeren Sachverhalt zu verweisen.
Die 1. Differenzierung von Datenarten: qualitative Daten vs. quantitative Daten
Wie und von wem welche Daten erhoben werden, das macht sich zunächst einmal in der basalen Unterscheidung zwischen quantitativen Daten auf der einen und qualitativen Daten auf der anderen Seite bemerkbar. Dabei referiert diese Differenzierung auf die Art und Weise der Erhebung: quantitative Daten bestehen grundsätzlich aus zählbaren, numerischen Werten, wohingegen qualitativen Daten aus nicht-numerischen, beschreibenden Informationen bestehen.
Qualitative Daten besitzen so beispielsweise eine geringere Aussagekraft hinsichtlich genereller Trends und werden gemeinhin als weniger objektiv wahrgenommen als ihr quantitativer Counterpart. Sie bieten allerdings mehr Raum für eingehende Kontextualisierungen an und vermögen ein tieferes Verständnis von konkreten Situationen zu präsentieren.
Geht es um die Erhebung solcher Daten, bleibt festzustellen, dass sich bereits an dieser Stelle ausdifferenziert, welche Arten von Daten letztlich erhoben werden: Interviews führen eher zu qualitativen Daten, standardisierte Fragebögen oder maschinelle Messungen führen zu einem quantitativen Output.
Die 2. Differenzierung von Datenarten: strukturtechnische Unterschiede von Daten
Eine weitere Unterscheidung von Daten liegt in der immanenten Struktur der erhobenen Informationen. Diesbezüglich gibt es drei generelle Kategorien, die vor allem auf die entsprechende Speicherung einzahlen. Die konkreten Datenarten lauten wie folgt:
Als „strukturiert“ werden solche Daten bezeichnet, die in einer klar definierten und organisierten Form vorliegen. Solche Informationen kommen bereits gut formatiert daher und folgen einem einheitlichen Schema oder einer festgelegten Struktur, die es einfach macht, sie zu speichern, abzurufen und zu analysieren.
Im Gegensatz zur ersten Kategorie stehen unstrukturierte Daten, die keine festgelegte Struktur oder Hierarchie besitzen. Diese Daten sind oft nicht in einer leicht analysierbaren oder einfach durchsuchbaren Weise organisiert, sie sind gewissermaßen „roh“, d.h. sie bedürfen der eingehenden Aufbereitung, um Verwendung finden zu können.
Semi-strukturierte Daten liegen im Spektrum zwischen strukturierten und unstrukturierten Daten. Im Gegensatz zu vollständig strukturierten Daten, die bereits in einer vollständig tabellarischen Form vorliegen, und unstrukturierten Daten, die nicht in kohärenter Form existieren, weisen semi-strukturierte Daten zwar eine gewisse (prototypische) Struktur auf, diese folgt allerdings nicht unbedingt einem fixen Schema. Diese Art von Daten ist bereits leichter zu durchsuchen und zu analysieren als unstrukturierte Daten, bietet jedoch immer noch mehr Flexibilität hinsichtlich der Handhabung an als vollständig strukturierte Daten.
Fazit zu Datenarten
Daten sind nicht gleich Daten! Es kommt immer darauf an, welchem Prozess die jeweiligen Informationen entspringen bzw. wie sie erhoben werden und welchem Zweck sie letztlich zugeführt werden sollen. Zwischen der Struktur, die auf den Sachverhalt der Speicherung einzahlt und der generellen Verfassung der Daten, die vor allem von dem Erkenntnisgewinn abhängt, den man sich von ihrer jeweiligen Nutzung verspricht, muss sich letzten Endes entschieden werden. Alles in allem handelt es sich also um eine strategische Fragestellung, die jede Organisation bzw. jedes Unternehmen mit Blick auf die eigene Zielsetzung beantworten muss: Mit welchen Datenarten will und muss man verfahren?