Wer konzeptionelle, theoretische Forschung betreibt, der sitzt mit rauchendem Kopf über seiner entstehenden Publikation, beim empirisch arbeitenden Kollegen hingegen raucht der überhitzte Rechner: So lassen sich die zwei grundlegenden Vorgehensweisen der Forschung charakterisieren, die dennoch aufs engste miteinander verbunden sind. Gemeinsam ist ihnen das Bestreben, falsifizierbare Aussagen zu liefern. Nachvollziehbare Erklärungen also, die dem kritischen Blick der Berufskaste widerstehen und sich gegenüber konkurrierenden Theorien als überlegen erweisen.
Eine Forschungsmethode kommt selten allein
Aus erdachten Modellen und theoretischen Grundlagen werden nach Möglichkeit testbare Voraussagen abgeleitet. Das Higgs-Boson-Teilchen war über Jahrzehnte eine Hypothese. Es entsprang einem Konzept, das von Peter Higgs vorgeschlagen und von verschiedenen Forschern, stets als Gedankenexperiment, Schritt für Schritt weiterentwickelt und vorangetrieben wurde. Dieses Konzept zu bestätigen erforderte hingegen einen 27 Kilometer langen Teilchenbeschleuniger, welcher jährlich Daten im Umfang von 25 Petabytes anhäuft. Genauso können geisteswissenschaftliche Konzepte testbare Thesen liefern, etwas über das Verhalten von Individuen.
Umgekehrt kann jeder, der eine Einführung in Statistik genossen hat, das „Korrelation-ist-keine-Kausalität“ Mantra mitbeten. Vielleicht kennen Sie den Datensatz, der belegt, dass Oliven-essende Europäer recht kleine Leute sind? Wer nichts versteht von unterschiedlichen kulinarischen Gepflogenheiten und von der regionalen Verteilung von Körpergrößen, der mag versucht sein, dem angehenden Basketballer von Oliven abzuraten. Empirie erfordert stets eine solide Theorie als Grundlage (durch welchen physischen Prozess hemmt denn die Olive das Wachstum?). Das Nachliefern der Theorie ist gestattet, schließlich führte der fallende Apfel zum Konzept der Erdanziehungskraft, nicht umgekehrt. Sie wegzulassen galt bis vor Kurzem hingegen als verpönt, ja als unwissenschaftlich.
Big Data: Triumph der Empirie?
Seit Daten eher beiläufig angehäuft werden, haben sich technische Möglichkeiten entwickelt, diese effizienter und vielfältiger zu nutzen. Big Data hält in viele Fachbereiche Einzug, einschließlich solcher, bei welchen die Arbeit mit Daten wenig Tradition hat. Beispielsweise können Algorithmen die Entwicklung des Sprachgebrauchs analysieren und so dazu beitragen, historische Texte zu datieren. Die schiere Menge an Daten erlaubt Analysen in nie dagewesener Schärfe und Breite. Macht dieser Siegeszug die Theorie überflüssig? Reicht es für den politischen Plakattexter vor der Wahl, jene demographische Gruppe anzusprechen, die am ehesten zur Wahl gehen wird? Oder muss er auch ihre Motivation verstehen? Reicht für einen Patienten die Information, dass eine gewisse Ernährungsweise den Krankheitsverlauf positiv beeinflussen könnte, oder muss der Wirkungsprozess zwangsläufig bekannt sein? Immerhin: Google hat mehrere erfolgreiche Businessmodelle auf der Idee der Korrelation ohne erklärende Theorie aufgebaut: Weshalb sich jemand mit einem bestimmten Surfprofil eher für ein gewisses Produkt interessieren wird ist irrelevant, nur die Wahrscheinlichkeit, auf eine platzierte Werbung anzusprechen, zählt. Ähnliches gilt von Suchmaschine bis Übersetzungsalgorithmus.
Daten vermehrt auszukosten liefert auch in der wissenschaftlichen Forschung interessante Impulse. Die Berichterstattung an Wahlsonntagen stellt hingegen regelmäßig unter Beweis, dass die Beweggründe der Daheimgebliebenen von hoher Brisanz sind, an konkurrierenden Thesen und Theorien mangelt es nicht. Ebenso werden sich Mediziner oder Pharmakonzerne zweifellos für den Wirkungsprozess bestimmter Nahrungsmittel und Verhaltensweisen interessieren, für mögliche Weiterentwicklungen oder Effekte bei ähnlichen Krankheiten. Die Dateneuphorie sollte nicht als Siegeszug einer Art von Forschung gesehen werden, weder in der Grundlagenforschung noch in der Anwendungsentwicklung. Theorie und Empirie gehen unverändert Hand in Hand. Riesige Datensätze über fallende Äpfel allein hätten kaum ausgereicht, um Isaac Newtons Neugier zu stillen.