Fußball und Wahlkampf haben eines gemeinsam: Es gewinnt nicht der, der schöner spielt, sondern der, der den Ball häufiger regelgerecht über die gegnerische Torlinie bringt. Und am Ende triumphieren oft die, die ihre Kräfte 90 Minuten lang geschont und am Ende das entscheidende Tor erzielt haben.
Etwas Ähnliches dürfte das Team "Obama for America" (OfA) im Kopf gehabt haben, als es daran ging, den Wahlkampf für den alten und neuen US-Präsidenten Barack Obama zu planen. Mit Hilfe moderner Datenanalysetechnik versuchte es, nicht den Ballbesitz zu maximieren, sondern die entscheidenden Pässe zu spielen.
Das Wahlmännersystem
Nach dem US-Wahlrecht geht jeder Staat komplett an einen der Kandidaten. Das heißt, die drei bis 55 "Wahlmänner" des jeweiligen Bundesstaates -die Zahl verhält sich in etwa proportional zur Bevölkerung - stimmen geschlossen für denjenigen Bewerber, der die breiteste Zustimmung erhalten hat.
Es ist also verlorene Liebesmüh, in einem Staat mehr als 51 Prozent erreichen zu wollen. Außerdem gilt es, vor allem die bevölkerungsreichen Bundesstaaten mit einer großen Anzahl von Wahlmännerstimmen für sich zu gewinnen.
Dabei gibt es Staaten, die traditionell in eine politische Richtung tendieren und sehr schwer umzustimmen sind. So gehen beispielsweise New York und Kalifornien immer an die Demokraten, Texas an die Republikaner. Und dann ist da noch eine Handvoll "Swing States", beispielsweise Ohio, bei denen der Unterschied zwischen den beiden Kandidaten häufig nur wenige Prozentpunkte ausmacht.
Hier können wenige Wählerstimmen einen gewaltigen Unterschied bedeuten. So hatte Al Gore bei der Präsidentschaftswahl 2000 über das gesamte Land gerechnet eine halbe Milliarde mehr Stimmen als George Bush der Este. Aufgrund knapper Mehrheiten in einigen Swing States (und einem extrem umstrittenen Ergebnis in Florida) musste sich Bill Clintons einstiger Vizepräsident jedoch seinem Widersacher geschlagen geben.
Will man also eine erfolgreiche und effektive Kampagne fahren, muss man sich auf die Staaten und Personen konzentrieren, die sich tatsächlich durch Argumente und Überredungskunst gewinnen lassen. Und das am besten noch mit vertretbarem Aufwand. Denn eine Wählerstimme zu gewinnen ist je nach Bundesstaat unterschiedlich teuer, erläutert Rayid Ghani, Chief Scientist der OfA-Kampagne: "In Colorado kostet es uns sechs bis sieben Dollar, in Kalifornien nur einen Cent."
Das Problem: Resource Allocation
Daraus ergeben sich zwei Fragen, so Ghani, der häufig als "Obamas Geheimwaffe" oder "das Gehirn hinter dem Obama-Wahlkampf" bezeichnet wurde. Diese Fragen lauten:
-
Wo lassen sich überhaupt Wähler überzeugen?
-
Was kostet es, sie zu überzeugen?
-
Wo also investiere ich sinnvollerweise den zur Verfügung stehenden Betrag?
Mit diesen Fragen im Hinterkopf ging "Obama for USA" schon 2010 daran, Daten über die US-Wählerschaft zu sammeln. "Wir hatten gegenüber den Republikaner einen Vorteil", räumt Ghani ein: "Unser Präsidentschaftskandidat stand schon lange vor der Wahl fest." Die Gegner mussten sich hingegen erst noch auf einen auf einen Herausforderer einigen, konnten ihren Wahlkampf also spät auf Mitt Romney zuschneiden - und damit auch einen Teil der Spendenvolumina erst kurz vor der Wahl aktivieren.
OfA machte viel aus diesem Vorsprung. So gelang es dem Team rechtzeitig, die Wählerstimmung in den Swing States nicht nur zu eruieren, sondern auch zu beeinflussen. Die unentschlossenen, aber aufgeschlossenen Wähler wurden herausgesiebt, gewichtet und nach einem ausgeklügelten Plan auf unterschiedlichen Kanälen angesprochen.
- Big Data in Zahlen
Karl Valentin hat einmal das Bonmot geprägt, schwer sei leicht was. Das kann man für den Trend Big Data mit Sicherheit auch behaupten. Sinnvoll in der Theorie, schwer in der Realisierung. Wir liefern ein paar Fakten. - Welche Probleme sehen Sie beim Einsatz von Big Data?
Big-Data-Konzepte werden nicht vorangetrieben, weil es an den richtigen Skills fehlt.<br> Angaben in Prozent; n = 206; Mehrfachnennungen möglich; Quelle: BARC
Datenmaterial zunächst dürftig
Nicht nur Geld und Personal, auch das Datenmaterial war zunächst dürftig, sagt Ghani. In den USA gibt es kein zentrales Einwohnermeldeamt, an das man sich mit Anfragen wenden könnte. Wer wählen möchte, muss sich allerdings in - mindestens - eine der pro Bundesland geführten und öffentlich zugänglichen Wählerlisten eintragen. Das war einer der Startpunkte für die Datenanalysten im Team. Allerdings galt es, diese Informationen vor Gebrauch sorgfältig zu "reinigen", denn es kam durchaus vor, dass ein und dieselbe Person in drei verschiedenen Staaten geführt wurde.
Auch die Wahllisten der vorangegangenen Präsidentschaftswahl lieferten halbwegs brauchbare Informationen. Hinzu kamen die Datenbank der freiwilligen Helfer und der Spender. Diese Menschen bildeten den Nukleus eines wachsenden Netzwerks. Sie wurden darauf angesetzt, ihre Kontakte anzusprechen, die -falls sie sich als willig herausstellen - wieder in ihrer Nachbarschaft tätig werden sollten. "Am leichtesten lassen sich ja die Leute überreden, die einem selbst ähnlich sind", erläutert Ghani.
So gab es bald überall "Neighbourhood Teams", die sich erheblich leichter taten, die potenziellen Wähler zu selektieren und in der richtigen Form anzusprechen, als ein anonymes Walkampfteam. Es ging darum, die jeweiligen politischen Ansichten und die persönliche "Wahlhistorie" kennenzulernen sowie herauszufinden, inwieweit die Person offen für Argumente und Überredungsversuche wäre, ohne dass sie sich dadurch belästigt fühlen würde. "In den USA reden die Leute offener über ihre Wahlvorlieben als in Europa", stellt Ghani klar.
Das DataWarehouse kommt ins Spiel
Mit den existierenden Datenbanken und neu gewonnenen Informationen wurde ein DataWarehouse gefüttert, das die Basis für Datenmodelle und -analysen bildete. Welche DataWarehouse- und Analysesoftware das Team nutzte, will Ghani nicht verraten. "Wir haben mit den Systemen unterschiedlicher Anbieter gearbeitet, viele Open-Source-Software genutzt und Einiges selbst gebaut", lautet seine lapidare Antwort auf allzu neugieriges Bohren: "Wir hatten ja vor allem am Anfang nur begrenzt Geld für die Infrastruktur zur Verfügung."
Eines hatte das Team allerdings sehr wohl: ein Team von 40 bis 50 Datenalytikern, die laut Ghani etwa ein Zehntel des gesamten OfA-Teams bildeten. Und obwohl sie nach Aussagen des Chefanalytikers schwer zu finden waren, brachten sie erstaunlich viel Knowhow mit - beispielsweise hinsichtlich des Open-Source-Dateisystems Hadoop. Mit ihm lassen sich schnell und preiswert rohe, aber durchaus funktionsfähige Datenmodelle zimmern. Allerdings erzeugt es einen gewissen Overhead, weshalb es als schwer zu handhaben gilt: "Doch wir hatten die Leute, die wussten, wie man damit umgeht", sagt Ghani.
Etwa zehn unterschiedliche Datenquellen aus Systemen unterschiedlicher Anbieter wurden über eine eigens dafür gebaute Middleware miteinander verbunden, aber nicht integriert: "Wir wollten kein System von Interfaces", stellt Ghani klar, "alles was wir wollten, war: die Daten nehmen, verarbeiten und wieder in die Ursprungsdatenbank zurückschieben, wo die Leute mit den Resultaten arbeiten konnten." Die gesamte Struktur war ja auf eine zeitlich begrenzte Nutzung angelegt: "Wenn wir ein bleibendes Unternehmen wären, hätten wir das sicher anders geregelt."
Dreifache Gewichtung der Wähler
Mit der "Hand am Arm" und in repräsentativen Umfragen ("Polls") wurde die Stimmung in dem beobachteten Teil der Wählerschaft kontinuierlich abgefragt und mit den vorhandenen Daten abgeglichen. 120 Millionen Telefonkontakte gab es im Verlauf der Kampagne, fünf Milliarden eMails wurden verschickt. Hinzu kamen unzählige Hausbesuche. Auf diese Weise wurden die Informationen immer mehr verfeinert und validiert. "Experimente" mit kontrollierten Verhaltensänderungen (mehr eMails, weniger eMails, neue Informationskanäle etc.) halfen dem Team, seine Taktik zu perfektionieren.
Am Ende hatte man weniger eine Liste als eine Matrix von Wählerprofilen. Diese Matrix ermöglichte eine jeweils abgestimmte Taktik der Ansprache, denn sie war in drei Dimensionen gewichtet:
-
zum einen nach dem Grad der Unterstützung für Obama,
-
zum zweiten nach der Chance, sie zu für eine Meinungsänderung zu gewinnen,
-
zum dritten nach der Bereitschaft zu wählen.
Der letztgenannte Aspekt spielt in den USA, wo die Wahlbeteiligung meist um die 60 Prozent liegt, eine große Rolle. Denn was nützt ein Wähler, der mit viel Mühe von der Politik des Präsidenten überzeugt wurde, aber zu träge ist, sich in Wählerverzeichnis einzutragen und sich auch noch am Stichtag ins Wahllokal zu bemühen?
Die weiter als lohnend eingestuften Kontakte wurden nach einem sorgfältig errechneten Schema angesprochen - je nach "Rang" in der Matrix, Wichtigkeit des Staates und Kosten der Kontaktaufnahme. Mit Hilfe von Polls vor und nach den Aktionen kontrollierte das Team den Erfolg seiner Argumente und Überredungskünste.
- In sieben Schritten zum Big-Data-Erfolg
Teil- oder unstrukturierte Daten in großer Menge erfolgreich analysieren können - das ist das Ziel von Big-Data-Projekten. Aber welcher Weg führt dorhin? - 1. Die jeweiligen Ziele definieren
Die Anzahl der möglichen Big-Data-Analysen ist Legion. Im ersten Schritt muss also geklärt werden: Was möchten Sie erreichen? Was bringt Ihnen die Auswertung? Möchten Sie mehr Kunden ansprechen, Ihren Umsatz steigern oder neue Geschäftsfelder erschließen? Und welche Ziele sind überhaupt erreichbar? - 2. Die Datenquellen identifizieren
Dann müssen die verfügbaren Datenquellen analysiert werden: Welche sind wichtig? Wie und in welcher Form lässt sich auf die benötigten Daten zugreifen? Meist ist es sinnvoll, sich zunächst auf ausgewählte Quellen zu konzentrieren. Hier schon sind Datenschutzaspekte zu berücksichtigen. Manche Daten dürfen gar nicht oder nur unter bestimmten Voraussetzungen gespeichert und analysiert werden. - 3. Mit IT- und anderen Bereichen vernetzen
Die IT sollte frühzeitig eingebunden werden. Um maximalen Nutzen aus den Auswertungen zu ziehen, sind auch andere Fachbereiche zu involvieren. Und spätestens in dieser Phase sollte das Management einbezogen werden, das breite Unterstützung garantiert. - 4. Performance und Verfügbarkeit klären
Die Erwartungen bezüglich Performance und Verfügbarkeit müssen so früh wie möglich dingfest gemacht werden. Dabei spielen Themen wie Analyse-Latenzzeit, Auswertungen in Echtzeit und In-Memory-Technik eine wichtige Rolle. - 5. Die Ergebnisse in Prozesse einbinden
Erfolgreiche Big-Data-Analytics-Projekte binden die Analysen und deren Ergebnisse in die Geschäftsprozesse ein. Nur so führen die gewonnenen Erkenntnisse zu einer Verbesserung. - 6. Big Data in Analysestrukturen einfügen
Big-Data-Analytics ersetzen nicht zwingend vorhandene Analysen, beispielsweise Data Warehouses. Oft sind sie vielmehr eine Ergänzung. Folglich sollten sie in vorhandene BI-Architekturen oder -Landschaften integriert werden. - 7. Komplexität und Dynamik abschätzen
Welche Daten mit welchem Volumen kurz- und mittelfristig verfügbar sein werden, ist im Vorfeld schwer abschätzbar. Deshalb gilt es, die Einbindung neuer Datenquellen oder zusätzlicher Analysen einzukalkulieren, um einen nachhaltigen Erfolg des Projekts zu gewährleisten.
Auf allen Kanälen
Auf der Basis des DataWarehouse baute das Team diverse Tools. Eines steuerte beispielsweise den E-Mail-Versand , wobei es die Adressen in Einklang mit dem jeweils gültigen Wähler-Ranking auswählte: Auf Knopfdruck ließen sich bestimmte Mails bestimmte nur an die erfolgversprechendsten zehn oder 20 Prozent der Profile versenden.
Ein anderes Tool war dazu bestimmte, das Soziale Netzwerk Facebook für die OfA-Zwecke zu nutzen: Wenn ein Sympathisant Inhalte der Kampagne mit seinen "Freunden" teilte und diese dem Link folgten, glich das Softwarewerkzeug deren Facebook-Profile mit den vorhandenen Datenbankinhalten ab. So ließen sich weitere interessante Kontakte herausfiltern.
Die Entscheidung, welcher Kanal für welche potenziellen Wähler der erfolgversprechendste sei, wurde auch mit Hilfe der Datenanalyse gefällt. Sogar die Wahl der Themen, auf die der jeweilige Mensch positiv reagieren würde, ließ sich aufgrund der im DataWarehouse gesammelten Informationen treffen. "Doch was immer wir mit den Online-Tools machten, wir mussten die Leute dazu bringen, offline zu agieren", erinnert Ghani daran, dass es sich keineswegs nur um statistische Spielereien handelte.
Am Ende ging die Rechnung jedoch auf: Obama siegte gegenüber Mitt Romney mit einem Vorsprung von zwei Staaten, aber er gewann 332 gegenüber 206 Wahlmännerstimmen. Ob die Datenanalyse den Ausschlag dafür gegeben hat? "Wir hätten vielleicht dieselben Stimmen gewonnen, aber es hätte mehr Geld gekostet", sagt Ghani. Die Informationstechnik erhöhe einfach die Erfolgswahrscheinlichkeit: "Ohne uns lag sie bei 60 Prozent, mit uns bei 80 Prozent." Und das sollen die politischen Gegner nicht gewusst haben? "Doch sicher, die Republikaner hatten bestimmt auch ein solches System, sie konnten aber erst später anfangen, es zu nutzen."
Fund Raising und Finanzplanung
Neben dem Gewinnen von Wählerstimmen erfüllte die Datenanalyse im OfA-Team zwei weitere Aufgaben. Mit ihrer Hilfe ließen sich zum einen auch die Personen ermitteln, die empfänglich für die Bitte um Spenden waren. Und selbstverständlich gab es auch in dieser Beziehung eine abgestufte Taktik: "Jemanden, der gerade 10.000 Dollar gespendet hat, darf man nicht mit einem Massen-Mailing belästigen, in dem um einen kleinen Beitrag von fünf Dollar geben wird, sonst riskiert man, ihn sauer zu fahren", führt Ghani aus.
Insgesamt haben die Fundraising-Aktivitäten eine Milliarde Dollar eingebracht. Etwa 60 Prozent davon seien durch eMails gewonnen worden, berichtet der Chefanalytiker: "Bieten Sie den Leuten einen Link an, auf den sie klicken können. Viele werden es tun und ihre Kreditkarteninformationen weitergeben."
Das zweite Einsatzfeld der Datenanalyse war die interne Finanzplanung, die sich von der in einem Unternehmen üblichen doch unterschied: "Eine Infrastruktur braucht man am Anfang, nicht am Ende des Wahlkampfs, wenn die Gelder besonders üppig sprudeln", erläutert der Chefanalyst, "deshalb mussten wir am Anfang Geld ausgeben, das wir noch gar nicht hatten." Mit Hilfe von Vorhersagemodellen ließ sich aber das Risiko im Rahmen halten, sprich: Ausgaben und erwartete Einnahmen in ein gesundes Verhältnis bringen.
Beim nächsten Mal ist alles anders
Die OfA-Truppe hatte nicht viel, worauf es sein Analysesystem aufbauen konnte. Auch das nächste Wahlkampfteam der Demokraten wird quasi bei null anfangen müssen. Zwar behält die Partei die Infrastruktur, aber innerhalb von vier Jahren wird die IT-Welt eine völlig andere sein. Zudem brach das Team nach Obamas Sieg auseinander. Ghani erläutert, warum: "Geld fließt nur vor der Wahl, also lässt sich eine solche Struktur zwischen den Wahlen nicht aufrecht erhalten."
Die gesammelten Daten existieren allerdings noch. Gemeinsam mit einem Teil des Teams wurden sie von einer privaten Initiative übernommen. Sie nennt sich ebenfalls OfA, was aber heute "Organizing for Action" bedeutet. Die Initiative hat es sich zur Aufgabe gemacht, Obamas Politik zu propagieren, derzeit vor allem die Änderung der Immigrationsgesetze. Dazu nutzt sie vor allem die zahlreichen E-Mail-Adressen aus der Wahlkampagne.
Ghani selbst hat sich einem neuen Projekt an der University of Chicago verschrieben. Es versucht, die in der OfA-Kampagne entwickelten Modelle auf andere Einsatzgebiete wie Gesundheitswesen und Erziehung zu übertragen. Beispielsweise könnten solche Vorhersagemodelle dazu dienen, potenzielle Schulabbrecher zu identifizeren und zum Bleiben zu überreden, erzählt Ghani mit leuchtenden Augen. (mhr)