Big Data

Das Geschäft mit den großen Datenmengen

Big Data bedeutet in erster Linie das schnelle Verarbeiten immens großer Datenmengen. Ein bekanntes Beispiel ist die Google-Suchmaschine, die uns in Windeseile als Ergebnis das Auffinden von Informationen zu den von uns gesuchten Begriffen aus Milliarden weltweit verstreuter Internet-Seiten liefert.

Warum ist das möglich?

Im Jahre 1965 veröffentlichte Gordon Moore seine Prognose. Einfach hochgerechnet sind das über 50 Jahre und macht eine Steigerung von optimistisch 252, pessimistisch gerechnet 226 aus, stellt heute, 2017, so ungefähr den 100-Billionen-fachen (oder pessimistisch gerechnet den nur 150-Millionen-fachen) Wert des Jahres 1965 dar. Ein schönes Beispiel zur Erklärung exponentiellen Wachstums ist das Märchen vom Reiskorn und Schachbrett.

Google Translate z.B. war einmal ein ehrgeiziges Projekt, das aufgrund von auf linguistischen Regeln beruhenden Algorithmen die automatische Übersetzung bewegen sollte. Heute kann man es sich leisten, Computer mit Milliarden von in vielen Sprachen vorliegenden Texten zu füttern und dann ausrechnen zu lassen, wie am wahrscheinlichsten ein deutscher Satz in englischer Sprache lauten wird. Das ist big data.

Daten in big Data-Systemen

Das klassische Instrument der Datenspeicherung sind Datenbanken. Sie enthalten - meist in Tabellenform - nach strengen Regeln strukturierte Daten. Doch mit neuen Software-Werkzeugen wurde es möglich, auch unstrukturierte Daten zu speichern und für sie neue Auswertungsmethoden zu finden. Gerade die Internet-Anbieter haben sich auf diesem Wege hervorgetan. Die geringen Kosten für die Speicherung führten dann auch dazu, Daten länger zu speichern, als dies für die Erfüllung ihres ursprünglichen Zwecks erforderlich war.

mehr dazu in dem Buch
Big Data
Die Revolution,
die unser Leben
verändern wird


von Victor Meyer-Schönberger
und Kenneth Cukier

Diese neuen Datensammlungs- und Analysewerkzeuge werden in großem Stil dazu führen, die Welt auf eine andere Weise zu verstehen, die wir erst erahnen müssen. Man kann die unterschiedlichsten Daten, aus völlig verschiedenen Quellen, zusammfügen, z. B. Daten über das Wetter, über Verkehrsunfälle, Großveranstaltungen, Grundbucheinträge und Benutzerverhalten im Internet, um daraus zu heute noch unbekannten Fragestellungen in Zukunft kluge Antworten zu erhalten, so die Hoffnungen und Versprechen der Anbieter. In Firmen bedeutet dies zum Beispiel, die in Datenbankformaten gut strukturierten Personaldaten lassen sich kombinieren mit den

Workflows sind ebenfalls eine sehr begehrte Datenquelle, denn hier ist registriert, wer was mit wem wann gemacht hat, welche Transaktionen mit welchem Ergebnis aufgerufen wurden. Die Zauberformel der Anbieter versteckt sich hinter der Vokabel predictive analytics. Dazu Bill McDermott, dezeitiger Chef der SAP:

McDermottDas System muss uns sagen können, was zu tun ist. Basierend auf Algorithmen sowie Informationen und Eingaben in der Datenbank müssen wir Sie beraten können hinsichtlich des nächsten Schritts in Ihrem Verkaufsprozess – mit wem Sie sich treffen sollten, was die voraussichtlichen Ergebnisse sein werden und mit welcher Wahrscheinlichkeit Sie einen Abschluss erzielen können.

SAP entdeckt Maschinenlernen, Künstliche Intelligenz und Augmented Reality, in: silicon Pressedienst vom 19.5.2016

Maschinenlernen , so McDermott weiter, werde die Mitarbeiter zudem von zuvor mühsamen Aufgaben befreien. Als ein Beispiel führt er den Abgleich von Bewerbungen mit dem Anforderungsprofil der Personalabteilung an. Das alles, wohlgemerkt, soll die Software leisten.

Ein so eindrucksvolles wie bedenkliches Beispiel ist die Verwendung von Big Data-Methoden im amerikanischen Wahlkampf 2016.

Die europäischen Datenschutzregeln dagegen sehen vor, dass personenbezogene Daten nur im Rahmen strikter Zweckbindung verarbeitet werden dürfen. Das Sammeln von Personendaten zu Zwecken, die vor dem Einsammeln nicht festgelegt waren, gilt als unzulässige Vorratsdatenspeicherung, immer wieder versucht und - bisher - immer wieder von den Verfassungsgerichten (Bundesverfassungsgericht, Europäischer Gerichtshof) abgewiesen.

Gerne werden die genannten und mit reichlich Vorschusslorbeeren versehenen Softwareleistungen unter dem Ticket Künstliche Intelligenz gehandelt.

 

 

Karl Schmitz, Oktober 2017