Ein geposteter Status hier, eine Ortsbestimmung da und eine gigantische Menge anderer Daten fliegen kreuz und quer um uns herum, teilweise ohne dass wir es genau wissen. Diese Daten sind nicht erst seit dem Auffliegen der NSA-Affäre ein großes Thema, auch die Wirtschaft und Politik entdecken Big Data immer mehr für sich. 

Als Barack Obama durch seine Kampagne 2012 sich eine zweite Amtszeit sicherte, war überall die Rede von der überragenden Rolle und dem Einsatz von Social Media im US-Wahlkampf, die ja Obama schon 2008 zum Wahlsieg getragen haben. In der Analyse wurde aber ein Instrument fast gänzlich außer Acht gelassen, dass Obamas Berater für sich einsetzten: Big Data. Aber was bedeutet dieser ebenso ominöse wie omnipräsente Begriff eigentlich? Und was hat Obama damit zu tun?

 Ursprünglich stammt der Begriff aus den Naturwissenschaften, konkret der Astronomie und Genetik, wo sich am Ende des 20. Jahrhunderts eine wahre Datenexplosion ereignete. Da Internetanbieter wie Google oder Yahoo naturgemäßüber die meisten Daten verfügten, waren sie es auch, die das größte Interesse hatten, den Schatz zu heben. Google sammelt am Tag 24 Petabyte (1 Pb = 1000 Tb) an Daten, das sind tausendmal mehr als alle gedruckten Werke in der größten US-Bibliothek zusammen. Dazu müssen diese Berge von zusammenhanglosen Informationen geordnet und gesichtet werden, um die versteckten Muster und Möglichkeiten zu entdecken. Und diese bedeuten dann Geld oder Macht. Der Oxford Professor und Experte Viktor Mayer-Schönberger erklärt es treffend: „Big Data ist das, was man in großem, aber nicht im kleinem Maßstab tun kann, um neue Erkenntnisse zu gewinnen oder neue Werte zu schaffen, sodass sich Märkte, Organisationen, die Beziehungen zwischen Bürger und Staat und vieles mehr verändern.

 Obama und sein Team nutzten diese Unmenge an Daten geschickt aus, um ihren Wahlkampf möglichst zielgenau auszurichten. Im Fachjargon heißt das datengestütztes Microtargeting. Ob nun personifizierte E-Mails mit Spendenaufrufen (immer noch das wichtigste Online-Werkzeug im US-Wahlkampf) oder zielgenaue Werbung in den Werbepausen einer bestimmten Serie, die Grundlage bilden geordnete und analysierte Datensätze. So war es dem Wahlkampfteam möglich, ohne große Streuverluste, jene Menschen anzusprechen, die für ihre Kampagne relevant waren. Wahlkämpfe haben keine Zeit an den Türen oder Computern potenzieller Gegner zu verlieren, wichtiger ist es potenzielle Unterstützer zum Laufen zu bekommen. Projekt Narwhal war 2012 das bedeutendste Instrument der Obama Kampagne für die Nutzung und Auswertung von Big Data, eine Art Schnittstelle, die es ermöglicht, verschiedene Datensätze miteinander zu verbinden und zu analysieren. Dabei werden Daten aus verschiedenen Quellen wie z.b. Social Media Anwendungen mit den vorhandenen Informationen kombiniert.

 Via Trendsetter-App generierten der Webdienst Buzzfeed in Zusammenarbeit mit dem Techblog Engagdet die „The Politics of TV-Shows“bzw. „The Politics of Networks“ Grafiken. Auf mehreren Infografiken stellen sie anhand der Likes auf Facebook für verschiedene Serien grafisch dar, welche Fans der Serie XY beziehungsweise Seher welchen Networks welche politische Grundpräferenz haben. So sind beispielsweise Game of Thrones Fans und PBS Seher eher demokratische Wähler, während, Seher von FOX News und American Pickers auf die republikanische Seite tendieren. Pures, digitales Gold für jeden PR- Manager.

Wobei die klassische Wahlwerbung gerade erst an der Oberfläche der Möglichkeiten kratzt, Experten schätzen, dass der Markt für Big Data Anwendungen von 4,6 Milliarden USD (2012) bis 2016 auf über 16 Milliarden USD anwachsen wird. Google beispielsweise erregte großes öffentliches Interesse, als es den Google Flu Index vorstellte. Ein Algorithmus, der durch gezielte Auswertung der Suchanfragen bestimmen soll wo und wann die nächste Grippewelle ausbrechen wird. Damit verspricht dieser Index in der Theorie der amerikanischen Gesundheitsbehörde einen entscheidenden Zeitvorsprung zur Bekämpfung der Krankheit, einen Vorsprung der oftmals Leben retten kann. Allerdings ist dieser Index auch ein perfektes Beispiel für die Tatsache, dass nicht alles was unter dem Label Big Data verkauft wird, auch wirklich funktioniert. Der Flu Index lag in 100 von 108 Fällen falsch, da Google die Rolle der medialen Berichterstattung und deren Einfluss auf die Onlinesuche unterschätzt hatte.

Ein weiterer Bereich, in den Big Data bereits Einzug gehalten hat, ohne dass wir es bemerkt haben, ist die Unterhaltungsbranche. Natürlich gab es auch in diesem Sektor schon lange Marktforschung, aber das Ausmaß, mit dem Daten und Algorithmen beginnen unser Sehverhalten zu beeinflussen, ist enorm. Der US-Streaming-Dienst Netflix analysierte die Sehgewohnheiten und Vorlieben seiner rund 44 Mio. User, um zu errechnen, welchen Content die Seher bevorzugt sehen wollen. Der Fan-und Kritikerliebling House of Cards, eine Polit-Serie mit Kevin Spacey, wurde auf der Basis ebendieser Nutzerdaten konzipiert und geplant. Dabei wurde nichts dem Zufall überlassen, sogar das Coverbild der Serie wurde durch eine Datenanalyse erstellt.

Wie diese Beispiele zeigen, geht es immer um Vorhersagen, egal ob es das Eintreten von Krankheiten, menschliches Verhalten oder wirtschaftliche Entwicklungen handelt. Aber es müssen nicht immer große Player wie Google oder Obamas Wahlkampfteam hinter diesen Projekten stehen, oft sind es kleine Start-Ups mit einer konkreten Idee, die sich die immensen Datenmengen zunutze machen. Zum Beispiel Oren Etzioni, der sich über zu teure Flugtickets ärgerte und daraufhin Projekt Hamlet startete (Kaufen oder Nicht-Kaufen, das ist hier die Frage), aus dem sich später das 110 Millionen Dollar Start-Up Farecastentwickeln sollte. Der studierte Informatiker designte ein auf 200 Milliarden Flugpreisdaten basierendes Vorhersagemodell, das auf Basis der Wahrscheinlichkeit errechnete, wann ein Flug am günstigsten ist. Klingt sehr gewagt, aber in der Praxis lag das System in Dreiviertel der Fälle richtig und sparte den Kunden viel Geld.

Dass diese digitale Sammelwut natürlich grundsätzlich mit Vorsicht zu genießen ist, wissen wir alle seit Edward Snowdens Aufdeckungen. Für viele Annehmlichkeiten und Online-Services wie Amazon oder Spotify bezahlen wir mit personenbezogenen Informationen, die uns für Wirtschaft sowie Politik berechenbar machen und die Privatsphäre aushöhlt. Es entbehrt nicht einer gewissen Ironie der Geschichte, dass es 20 Jahre nach dem Fall des Spitzelstaates DDR in einem Umkreis von 200 Metern um Georg Orwells (1984) Wohnung in London mehr als 30 Überwachungskameras gibt. Auch das ist eine Folge von Big Data und wer einmal die US-Serie Person of Interest gesehen hat, weiß, wohin das führen kann. Was die DDR trotz gigantischer Aktenarchive nicht konnte, nämlich vorhersagen, wer ein Dissident werden wird, ist heute durch Big Data möglich. US-Polizeibehörden verwenden bereits Algorithmen, um ihre Streifen zu koordinieren.