en
de
Big Data in der Industrie

Daten als Rohstoff

26 März 2014
| |
Lesezeit: 5 Minutes

Für IT-Unternehmen ist „Big Data“ ein Begriff mit besetzten Assoziationen, der ohne Scheu für alle möglichen Szenarien verwendet wird. Doch was bedeutet das für Industrieunternehmen? Gelten dort ähnliche Gesetzmäßigkeiten wie in der IT?

Kondensiert ist hier meine Schlussfolgerung in sechs Punkten – beherzigen Sie bei der Diskussion um den Einsatz von Big-Data-Szenarien folgende Grundregeln:

6 Thesen als Weckruf

  • Daten für „Big-Data“- Analysen sollten möglichst roh erfasst und gespeichert werden.
  • Für die Industrie bedeutet das oft ein Umdenken in der Sensorik.
  • Die Speicherung der Daten muß in einer so unstrukturierten Form vorliegen, dass später Abfragen mittels Semantik statt über Relationen ermöglicht werden. Dafür sind oft neue Lösungen oder Produkte erforderlich.  Services aus der Cloud könnten Engpässe versorgen.
  • Schutz der Datenspeicherung und Übertragung wird viel wichtiger (Security), denn es handelt sich bei den gewonnenen Daten um einen für Ihre Geschäftsmodelle sehr wertvollen Rohstoff.
  • Zweitverwertungsmodelle sollten berücksichtigt werden, jedoch nicht zu zeitig den Business Case stützen müssen.
  • Die ethische und moralische Verantwortung im Umgang mit den Daten steigt gewaltig und muss zentral bedacht werden.

„Big Data“- ein Hauch von Gigantismus schwingt mit, vielleicht sogar Respekt oder schlichtweg eine völlige Unterschätzung der Auswirkungen dieses Phänomens. Denn Big Data ist keine Technologie, und Big Data ist auch kein Hype: Big Data ist ein Phänomen, das die Summe der Auswirkungen von massenhafter Informationserzeugung menschlichen Ursprungs beschreibt. Dazu kommt die Idee, Daten als Rohstoff zu behandeln.

Auf das Sammeln muss zwangsweise eine Veredelung folgen, damit eine Wertschöpfung stattfindet. Denn ohne Idee, welche Informationen man aus der Datenflut gewinnen kann, scheint Datensammelei unwirtschaftlich.

Nicht so bei digital erzeugbaren und speicherbaren Daten. Scheinbar wird jede Möglichkeit, Daten zu gewinnen, völlig unabhängig von der Nützlichkeit betrieben.

Und zwar weil man es kann und eigentlich auch weil es fast sicher ist, dass Sie diese Daten tatsächlich irgendwann einmal benötigen. Staaten tun es bereits sehr lang (Stichwort „Vorratsdatenspeicherung“), Unternehmen, deren Kern-Geschäftsmodell auf Informationsgewinnung und -Verarbeitung beruht, tun dies seit mindestens 10 Jahren.

Rohe Diamanten: Daten in der Industrie

Nun gibt es in der Industrie, die auf Automatisierungstechnik setzt, natürlich ein sehr ausgeprägtes Einsatzfeld für das Sammeln von Daten, nämlich fürs Überwachen von Anlagen (Leitstände, Produktionssysteme etc.).

Dafür gibt es auch absolut viele Möglichkeiten, sinnvolle Daten durch Sensorik einzufangen und dem Überwachungssystem zuzuführen. Aber klassischerweise endet dort das Leben der erfassten Daten sehr schnell, ohne das darin enthaltene Potenzial weiter zu nutzen.

Oder speichern Sie heute die Energieverbrauchswerte aller Aktoren aller Anlagen über deren Nutzungszeitraum? Die Temperatur jedes Raumes im Büro? Alle jemals in eine Maschine manuell eingegeben Daten? Die tatsächlichen Toleranzen aller gefertigten Bauteile? Wozu denn das, werden Sie fragen. Das kostet doch nur Geld!

Falsch! Damit lässt sich Geld verdienen.

Daten als Rohstoff und deren Gewinnung

Menschen, die auf Erdöl oder Kupfer stoßen, können erfolgreich werden, wenn sie die Lagerstätte gut ausbeuten. Aber natürlich müssen sie zu allererst erkennen, dass sie etwas Wertvolles gefunden haben. Sie müssen die Verarbeitungs-,  Aufbereitungs- und Distributionsprozesse beherrschen und ausführen, um aus dem Rohöl oder dem Erz ein wertvolles Produkt zu erzeugen. Die Lagerung ist oft ein notwendiges Übel, da die Lagerstätten meist fernab der eigentlichen Abnehmer liegen.

Analog dazu muß man sich die Gewinnung von Daten vorstellen. Es gehört eine Portion Fantasie dazu, den Wert von Daten für sich oder andere einzuschätzen.

Oft entstehen die interessanten Daten tatsächlich nicht an den Orten, wo man diese vermutet hat.

Der Transport und die Lagerung gehen heute sehr komfortabel von statten, dank technologischem Fortschritt. Internet, Breitband-Kommunikationsnetze und gigantische Speichermöglichkeiten im Peta-Byte-Bereich sind vorhanden oder können einfach gemietet werden (z.B. als Cloud Service).

Hört sich ja einfach an. Nun, die Sache ist heute an anderen Stellen mit Komplexität beladen, als diese einfache Analogie erscheinen lässt.

Die Datenquellen sind in der Regel im Besitz von Personen oder Unternehmen. Man muß also Allianzen oder Verträge schließen. Nehmen wir ein Beispiel:

Das Auto als mobiler Datengenerator. Ein modernes Auto hat Sensoren für Temperatur, Regen, Sonne, Standort, Höhe, Geschwindigkeit, Lenkwinkel und vieles mehr. Wenn man nun diese Daten in Echtzeit sammeln könnte, findet man sicherlich Abnehmer, die daraus Nutzen ziehen. Aber wem gehören die Daten? Dem Automobilhersteller,  dem Halter des Fahrzeugs oder dem Fahrer?

Eine weitere Unbekannte kommt bei den Sensoren selbst auf. In einem Industrieunternehmen sind heute ebenfalls Hunderte von Sensoren verbaut. Leider sind diese Sensoren sehr viel schwerer zugänglich für IT-Systeme, denn oft dienen sie der Steuerung und Überwachung, sind also sicherheitsrelevant oder mindestens produktionskritisch.

Zudem sind diese Sensoren oftmals zu einfach konstruiert, um Daten von anderem Wert zu erzeugen. Da gibt es Lichtschranken, Positions-Sensoren, Endschalter, die alle „nur“ zwei Zustände erkennen können. Das hat oft ausgereicht. Man hat die Maschine einfach soweit von ihrer Umwelt isoliert, dass beispielsweise Sonneneinstrahlung als Störfaktor ausgeschlossen werden konnte. Trotzdem kommt es zu Qualitätsschwankungen.

Sensoren, die mehr als ein Bit Informationsgehalt bieten, sind nun gefragt.

Über die Veredelung von Daten

Die bisher oft eingesetzte Automatisierungspyramide wird hier versagen. Denn Sensordaten von der untersten Feldebene werden von darüber liegenden Schichten gefiltert und mit einer Semantik versehen.

Zur Erklärung hilft auch das Modell einer digitalen Fotokamera. Der Sensor liefert 14 Megabit Pixeldaten an den Prozessor in der Kamera. Dieser ist in der Lage, die Daten auf 2-3 Mbyte zu komprimieren und Metadaten wie Standort, Kameratyp, Blende etc. hinzuzufügen. Ein solches Bild ist auf dem PC aber nicht mehr sinnvoll bearbeitbar, da bereits Informationen verloren sind. Besser zum Nachbearbeiten ist das Raw-Format, also alle 14 Megabit Pixeldaten.

Die Veredelung von großen Daten zu einer Menge von Informationen kann also sinnvoll nur an der Stelle erfolgen, wo der Nutzwert der zu erzeugenden Information klar ist.

Die Fotokamera macht hier nichts falsch, denn meist ist der Nutzwert auch mit dem JPEG-Bild erreicht. Man kann die Datenmenge reduzieren, wenn man weiß, wo die relevanten Informationen gewonnen werden können. Allerdings verliert man damit die Möglichkeit für Auswertungen aus anderer Perspektive.

Umgekehrt ein Beispiel aus der Fernwartung: Um die Transport-Menge von Daten klein zu halten, nutzt ein Hersteller von Produkten im Außeneinsatz einen Datenkonzentrator. Dieser hat eine fest eingebaute Vorverarbeitung, so dass die zu übertragenden Daten und damit auch die zu lagernde Menge in der Zentrale um Größenordnungen geringer werden. Das ist eine gute Lösung für einen fest definierten Einsatzzweck, da man vorab den Nutzwert der Daten eingrenzen konnte.

Die nackten Daten liegen nun nicht in der Zentrale vor, sondern  gefilterte Daten oder sogar schon Informationen, die eine Qualifikation mitbringen.
Das folgende Bild zeigt die Veredelungsstufen von Daten:

Big Data_Veredelungsstufen: Rohdaten erfassen, Nützliches Filtern, Quantifizieren, Qualifizieren, Präsentieren

Einige Sensoren decken bereits zu viele Schritte ab, als dass deren Daten einer Zweitverwertung zugeführt werden könnten. Auch dazu ein Beispiel:

Der Positionssensor an einer Laufkatze eines Kranes: Dieser Sensor ist meist so konstruiert, dass er aus dem Rohdatum bereits Störungen herausfiltert.

Die mechanischen Ereignisse „Laufkatze fährt an Positionssensor heran, ist genau davor, fährt nach rechts vorbei“ könnten zum Beispiel am Sensorausgang in die Semantik „Laufkatze hat Position 7 passiert“ umgewandelt worden sein. Wo ist der Unterschied?

Der Sensor kann nicht mehr dazu benutzt werden, um herauszufinden, von welcher Seite und mit welcher Geschwindigkeit sich die Laufkatze bewegt hat. Möglicherweise sind aber genau dass die Daten, die für präventive Wartung nötig wären.

Die effiziente Speicherung von Daten hat schon Tausende von Forschern beschäftigt. Bei Daten denkt man heute an Datenbanken. Und für Big Data logischerweise an sehr große Datenbanken? Ob das so ist, betrachte ich im anschließenden Beitrag „Lagern und veredeln – Big Data in der Industrie (2)„.

Ähnliche Beiträge

Big Data: Cloud-gestützte Lösungsansätze für vernetzte Produkte

„Industrie 4.0 und ihre Geschwister

Kommentare (1)

[…] Beitrag Daten als Rohstoff: Big Data in der Industrie (1) habe ich über die Erfassung und Speicherung roher Daten geschrieben. Nun müssen die nützlichen […]

×

Updates

Schreiben Sie sich jetzt ein für unsere zwei-wöchentlichen Updates per E-Mail.

This field is required
This field is required
This field is required

Mich interessiert

Select at least one category
You were signed up successfully.