Vom Nutzen und Wert der Daten

JvHNew articles

Zwischen-dem-Wert-und-der-die-Wirklichkeit-zutreffend-abbildenden-Akkuratesse-von-Daten-existiert-ein-Oppositionsverhältnis:-Ein-100%-zutreffendes-Datum-kann-nicht-der-Realität-entstammen
Wert der Daten
Zwischen dem Wert und der die Wirklichkeit zutreffend abbildenden Akkuratesse von Daten existiert ein Oppositionsverhältnis: Ein 100% zutreffendes Datum kann nicht der Realität entstammen

Je richtiger das Datum, desto geringer sein Wert?

In meinen beiden letzten Blog Posts hatte ich dargelegt, dass der derzeitige Daten- und KI-Hype in aller Regel übersieht, dass die Interpretation von Daten im Rahmen der „Data Science“, egal ob zum Zweck der Sachverhalts-Beschreibung (Descriptive Analytics), der Ursachenforschung (Diagnostic Analytics), der Prognose (Predictive Analytics) oder der Handlungsempfehlung (Prescriptive Analytics) subjektiv, also menschengemacht ist, wobei es keine Rolle spielt, ob diese subjektive Auslegung bereits Bestandteil einer Software ist oder im Rahmen der Dateneingabe oder eben der Auslegung der von einer KI bereitgestellten Information ist.

Dies vorausgeschickt, kann man aus diesem Befund allerdings nicht ableiten, dass das Sammeln und Auswerten von Daten grundsätzlich keine belastbaren Informationen liefern kann. Denn Daten können durchaus a) belastbare Informationen und b) außerdem auch noch sinn- und wertvolle Informationen liefern. Das ist aber nicht selbstverständlich.

Natürlich würde man spontan meinen, Daten seien umso besser und also wertvoller, je zutreffender sie sind. Aber erstens sind Daten per se eben nie zutreffend oder unzutreffend, wenn sie sich auf die empirische, also sinnlich erfahrbare Welt beziehen. Das können eben nur Informationen sein. Zweitens aber sind Daten dann, wenn sie tatsächlich nur in logisch geschlossenen Räumen jenseits der empirischen Wirklichkeit entweder richtig oder falsch sind, dann, wenn sie wahr sind, auch grundsätzlich wertlos.

Aber die Wirklichkeit ist nicht schwarz-weiß. Zwar gilt auch für die sinnlich erfahrbare Wirklichkeit gilt grundsätzlich: Zwischen dem Wert der dort gewonnenen Daten und der Zuverlässigkeit der daraus abgeleiteten Information besteht ein Oppositionsverhältnis, ein diametraler Gegensatz. Etwas, das mit logischer Notwendigkeit so und daher nicht anders beschaffen ist, kann in der sinnlich wahrnehmbaren Wirklichkeit gar nicht existieren. Der Erklärungswert eines solchen Datums ist mit Blick auf diese Wirklichkeit gleich null, der diagnostische, der prognostische und der prädikative Wert ebenso.

Es gibt aber Teilbereiche unserer Wirklichkeit, die sich ziemlich gut als beinahe logische Systeme verstehen lassen und andere, in denen das nicht so gut oder fast gar nicht geht. Immer dann, wenn sich Daten auf eine von Menschen definierte und von Menschen gemachte Welt unter weitestgehendem Ausschluss der Umwelt beziehen, sind diese Daten qua Definition zutreffend. Falsch oder fehlerhaft ist nicht das definitionsgemäße Datum, sondern allenfalls das nicht definitionsgemäß hergestellte Produkt.

Nehmen wir einen Chip, der regelkonform in einer Reinraumfabrik DIN 4 oder höher hergestellt wurde. Seine Beschaffenheit, seine definitionsgemäßen Qualitätsmerkmale und die korrespondierenden Daten werden bei diesem Chip mit Notwendigkeit anzutreffen sein. Insoweit dies nicht der Fall ist, wurde der Chip nicht regelkonform hergestellt. Punkt.

Aber welchen Wert haben Daten über die Beschaffenheit eines solchen Chips, wenn sich diese Daten bereits aus der Chip- bzw. Chip-Herstellungs-Definition ohne Ansehung des konkreten Chips ableiten lassen? Eigentlich nur den, im Falle einer Abweichung zwischen Soll- und Ist-Daten auf eine fehlerhafte Produktion rückschließen zu können.

In meinem nächsten Blog Posts möchte ich die unterschiedlichen Marktsegmente, in denen Daten und mit ihnen künstliche Intelligenz heute zum Einsatz gelangen unter diesen beiden Gesichtspunkten

  1. Zuverlässigkeit hinsichtlich der Abbildung der empirischen Wirklichkeit
  2. Wert der gewonnenen und verarbeiteten Daten

analysieren und daraus eine Matrix zum Wert von Daten in unterschiedlichen Marktsegmenten entwickeln.