Hintergrund und Technik
Seit Google 2004 damit begonnen hat, weltweit Bücher einzuscannen, hat der Suchmaschinengigant bislang 15 Millionen Bücher digitalisiert. In Kooperation mit Forschern der Harvard University hat Google jetzt einen Datensatz bestehend aus 5,2 Millionen Büchern, die innerhalb der letzten 200 Jahre in sieben verschiedenen Sprachen (Englisch, Deutsch, Französisch, Spanisch, Chinesisch, Spanisch und Hebräisch) erschienen sind, erstellt und unter der Creative Commons Lizenz zum Download bereit gestellt.
Eigentliches Highlight ist jedoch die Webapplikation Google Ngram Viewer mit der der riesige Datensatz von über 500 Milliarden Wörtern durchsucht werden kann. Über diese werkübergreifende Volltextsuche lässt sich in Sekundenschnelle die Entwicklung von Worthäufigkeiten über den Zeitverlauf und über die verschiedenen Sprachräume hinweg ermitteln. Nach etlichen Stunden des Ausprobierens bin ich von den Möglichkeiten des Werkzeugs (die ich zugegebenermaßen noch nicht alle durchblicke und auszuschöpfen vermag) begeistert und der Ansicht, dass Google fast stillschweigend einen forschungsmethodischen Meilenstein gesetzt hat.
Einige Anwendungsbeispiele
Wortgebrauch im zeitlichen Wandel
Für den deutschen Sprachraum lässt sich die Entwicklung der Wortnennungen von Kriminologie, Kriminalbiologie, Kriminalistik und Forensik anschaulich nachvollziehen. Um 1900 tauchen die Begriffe Kriminalistik und Kriminologie vermehrt in deutschsprachigen Veröffentlichungen auf (z.B. in der Encyclopädie der Kriminalistik von Hans Gross, 1901). Die meisten Nennungen von Kriminalistik entfallen auf das Jahr 1904. Seit 1950 entfallen die meisten Nennungen auf den den Begriff Kriminologie, wobei ein deutlicher (und von wenigen kleineren Einbrüchen abgesehen) kontinuierlicher Anstieg der Nennungen von Kriminologie in deutschsprachigen Publikationen zu verzeichnen ist.
Die Kriminalbiologie ist ein Begriff, der in den 20er und 30er Jahren des letzten Jahrhunderts größerer Verbreitung fand. Der Begriff steht in Verbindung mit Konzepten einer biologisch determinierten Kriminalitätsentwicklung, die vor allem in der Weimarer Republik und unter nationalsozialistischer Herrschaft Verbreitung fanden (so z.B. Grundriss der Kriminalbiologie von Adolf Lenz, 1927). Mit Ende des Zweiten Weltkrieges findet der Begriff kaum mehr Verwendung. Erst ab Mitte der 1980er Jahre kehrt der Begriff in die deutschsprachige Literatur zurück und wird hier zumeist im Kontext einer Aufarbeitung historischer Kriminalitätskonzepte verwandt (so z.B. Justiz-Strafrecht und polizeiliche Verbrechensbekämpfung im Dritten Reich von Gerhard Werle, 1989).
Der jüngste Begriff, der zudem die geringste Verbreitung aufweist, ist der der Forensik. Er taucht erst Mitte der 1980er Jahre vermehrt auf. Ende der 90er Jahre bis zum Ende des Untersuchungszeitraums 2008 ist ein steiler Anstieg der Begriffsnennungen zu verzeichnen. Diese Entwicklung ist allerdings auch auf die Verwendung des Begriffs im Kontext mit IT-Systemen (Computer-Forensik) zurückzuführen.
Kriminologie vs. Kriminalistik vs. Kriminalbiologie vs. Forensik
Sprachgrenzen-übergreifende Analyse
Aufschlussreich ist ebenfalls der Vergleich von Worthäufigkeiten über Sprachgrenzen hinweg. Die unten stehenden Graphen zeigen die Nennungen der Soziologen Emile Durkheim, Karl Marx, Pierre Bourdieu, Max Weber, Talcott Parsons und Norbert Elias im deutschen, französischen und englischen (unterteilt nach britischen und amerikanischen Veröffentlichungen).
In allen Sprachräumen sind die meisten Nennungen für den Namen Karl Marx auszumachen. Dies ist zweifelsfrei dem Umstand geschuldet, dass sowohl biographische Details zur Person Karl Marx als auch seine theoretischen Überlegungen zu Klasse, Kapital und Lohnarbeit disziplinenübergreifend Erwähnung finden. Max Weber findet sich – und dies gilt ebenfalls für alle untersuchten Sprachräumen – am zweithäufigsten erwähnt.
Für alle hier untersuchten Personennamen lässt sich deutlich erkennen, dass die meisten Namensnennungen jeweils im eigenen, muttersprachlichen Raum der jeweiligen Soziologen auszumachen sind. Im besonderen Maße trifft dies für Pierre Bourdieu im französischen und Talcott Parsons im englisch-amerikanischen Sprachraum zu. Sehr deutlich ist auch die zeitliche Differenz zu erkennen, die zwischen Rezeption im (eigenen) Sprachraum der Autoren und der Rezeption im Ausland (nach Vorliegen einer Übersetzung) liegt. Für den Namen Norbert Elias sind übereinstimmend für alle Sprachräumen die wenigsten Nennungen zu verzeichnen.
Soziologennamen in deutschsprachigen Veröffentlichungen
Soziologennamen in französischsprachigen Veröffentlichungen
Soziologennamen in britischen Veröffentlichungen
Soziologennamen in amerikanischen Veröffentlichungen
Quantitative Analysen zu spezifischen Theorien und Konzepten
Schließlich eignet sich der Google Ngram Viewer auch hervorragend zur Überprüfung oder Illustration sozialwissenschaftlicher Konzepte.
So analysieren beispielsweise die Philosophen Michel Foucault in „Überwachen und Strafen“ und Gilles Deleuze in „Postskriptum über die Kontrollgesellschaften“ einen gesellschaftlichen Wandel der Machtverhältnisse. Der Wandel von einer Disziplinar- hin zu einer Kontrollgesellschaft ginge mit einem zunehmenden Verzicht des Strafens und einem Mehr an Überwachung und (Selbst-)Kontrolle einher.
Die Wortnennungen von Überwachen und Strafen scheinen die These vom Wandel gesellschaftlicher Machtbeziehungen zu stützen. Da der Google Ngram Viewer „case-sensitive“ arbeitet, lassen sich sowohl die Nennungen der Substantive (obere Grafik) als auch der Verben (untere Grafik) analysieren.
Vor allem die Verwendung der Verben überwachen und strafen scheinen zu bestätigen, dass die deutschsprachige Kultur sich im Verlauf der letzten 200 Jahre zunehmend seltener mit Praktiken des Strafens dafür aber umso häufiger mit Formen des Überwachens beschäftigt hat.
Überwachen vs. Strafen (Nomen)
Überwachen vs. Strafen (Verben)
Der letzte Graph zeigt die Verteilung der Wortnennungen von Jugendkriminalität zum Einen und Ausländerkriminalität zum Anderen.
Die Vorstellung, dass Jugendliche nicht im vollen Maße strafmündig seien, fand in Teilen bereits im ersten allgemeinen, deutschen Strafgesetzbuch von 1532 (Constitutio Criminalis Carolina) Berücksichtigung. Ein Jugendstrafgesetz im heutigen Sinne wurde jedoch erst 400 Jahre später mit dem Jugendgerichtsgesetz (JGG) von 1923 verabschiedet. Diese Entwicklung im Bereich des Strafgesetzes spiegelt sich in den Worthäufigkeiten von Jugendkriminalität wider. Erst in den Jahren 1917/18 taucht der Begriff in nennenswerter Häufigkeit auf. Seither ist eine tendenziell kontinuierliche Zunahme der Wortnennung in deutschsprachigen Publikationen bis Anfang der 1950er Jahre zu verzeichnen. Von kleineren Schwankungen abgesehen, verharrt die Zahl der Wortnennungen bis 1990 auf identischem Niveau und steigt danach bis zum Jahr 2000 sprunghaft an. Seither ist ein erneuter Rückgang der Wortnennungen auf etwa das Niveau von 1950 zu verzeichnen.
Ein vergleichbarer Kurvenverlauf – auf sehr viel niedrigerem Niveau – ist auch für den Begriff der Ausländerkriminalität zu konstatieren: Mitte der 1980er Jahre taucht der Begriff in größerer Zahl in deutschsprachigen Publikationen auf. Die Zahl der Nennungen wächst nahezu kontinuierlich bis zum Jahr 2000. Seither ist ein kontinuierlicher Rückgang der Verwendung des Begriffs „Ausländerkriminalität“ zu verzeichnen.
Jugendkriminalität vs. Ausländerkriminalität
Die beiden letzten Beispiele verdeutlichen die Schwierigkeiten der Interpretation der Ergebnisse quantitativer inhaltsanalytischer Untersuchungen. Denn dem augenscheinlichen Schluss, dass Jugendliche vor 1913 respektive Ausländer vor 1985 ausschließlich rechtskonform gelebt haben, ist ebenso wenig zuzustimmen wie der Aussage, dass die Bundesrepublik im Jahr 2000 einer harten Prüfung durch massenhafte Angriffe auf die Normen- und Wertegemeinschaft seitens krimineller Jugendlicher und Ausländer (oder gar ausländischer Jugendlicher) ausgesetzt war.
Vielmehr gibt die quantitative Verteilung der Begrifflichkeiten Aufschluss über vorherrschende gesellschaftliche Diskurse – sie sagt jedoch nichts (oder zumindest wenig) über die Phänomenologie von Ereignissen aus. Darüber hinaus ist es völlig ausgeschlossen, auf Grundlage der quantitativen Verteilung eines Begriffes auf die Richtung gesellschaftlicher Entwicklung zu schließen. Möglicherweise (wenn auch nicht sehr wahrscheinlich) erfolgt die vermehrte Thematisierung von Jugend- bzw. Ausländerkriminalität jeweils im Kontext eines Rückganges der Kriminalitätsbelastung der beiden gesellschaftlichen Gruppen.
Auf eine Reihe weiterer Einschränkungen (aber auch Möglichkeiten) gehen die Harvard-Autoren des unten verlinkten Artikels ein, in dem die ersten Ergebnisse der umfangreichen Studie vorgestellt werden.
Weiterführende Links
- Jean-Baptiste Michel*, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, William Brockman, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman Aiden*. Quantitative Analysis of Culture Using Millions of Digitized Books. Science (Published online ahead of print: 12/16/2010)