Schwerpunkt

Rotkäppchen 2.0 - Teil 2

Von Lilo Berg

Wie häufig geht es in der deutschen und englischsprachigen Literatur um Gott?
Wie häufig geht es in der deutschen
und englischsprachigen Literatur
um Gott? Interessante Besonder-
heiten für die letzten beiden Jahr-
hunderte führt eine unkomplizierte
Vergleichs-Recherche mit dem
Programm Google NGram Viewer
vor Augen. Sie zeigt auch den prozen-
tualen Anteil des gesuchten Begriffs
an der Gesamtmenge aller Wörter
in der getroffenen Auswahl.

Es geht um Data-Mining und Big Data, um das Schürfen nach Wortgold in Datenbergen.

Meister in dieser Disziplin sind Erez Aiden und Jean-Baptiste Michel. Die beiden jungen Wissenschaftler haben an der Harvard University eine Einrichtung gegründet, die sie amerikanisch unbescheiden „Cultural Observatory“ nennen, eine Sternwarte der Kultur also. Aiden ist Physiker, Michel ist Ingenieur und beide sind darüber hinaus auch in den Lebenswissenschaften zu Hause. Analog zur Genomik, der Untersuchung aller Gene eines Lebewesens, nennen sie ihre Forschungsmethode für die Kulturwissenschaften Culturomics. „So wie die Genomik durch ein Vergrößerungsglas auf die Biologie blickt, wendet Culturomics die Datenanalyse auf das Studium der Kultur an“, sagte Erez Aiden auf einer im Internet zugänglichen TED-Konferenz.

Ihre Berühmtheit verdanken Aiden und Michel einer privilegierten Partnerschaft mit Google. Sie hatten schon früh Zugriff auf einen Wissensschatz, den der Internetkonzern mit seinem Projekt Google Books angehäuft hat. Damit verfolgt der amerikanische Konzern den ehrgeizigen Plan, so gut wie alle jemals gedruckten Bücher zu digitalisieren. Insgesamt sind das nach Schätzungen von Experten wie Gerhard Lauer 140 Millionen Bücher; geschafft hat Google inzwischen um die 25 Millionen Werke. Nur einen Teil davon nutzten die beiden Forscher Aiden und Michel für ihre aufsehenerregende Publikation im Wissenschaftsmagazin „Science“ im Jahr 2011: gut fünf Millionen Bücher mit 500 Milliarden Wörtern aus den letzten fünf Jahrhunderten.

So arbeiten die Digital Humanities
So arbeiten die Digital Humani-
ties
.

Um in dieser gigantischen Bibliothek zu forschen, entwickelten sie ein Programm namens Google Ngram Viewer. N-grams sind vom Nutzer festgelegte Begriffe oder Wortfolgen, deren Gebrauchsfrequenz das Programm in den nach Sprachen sortierten Textbeständen ermittelt und schnell und anschaulich als Diagramm darstellt. Das Programm steht kostenfrei für alle im Internet zur Verfügung, die Handhabung ist kinderleicht und die Ergebnisse sind oft verblüffend. Wer wurde in den vergangenen 50 Jahren in der deutschsprachigen Literatur häufiger zitiert: Albert Einstein, Sigmund Freud oder Karl Marx? Welche Künstler wurden von den Nazis am schärfsten zensiert? Sprechen wir heute weniger über Gott als früher? Welche Formulierung wird häufiger benutzt: making love oder having sex? Wie alt sind Schauspieler oder Politiker, wenn sie berühmt werden.

Amateurforscher können mit dem Google Ngram Viewer erstaunliche Entdeckungen machen, aber auch Profis nutzen das Instrument. Fotis Jannidis zum Beispiel, Inhaber des Lehrstuhls für Computerphilologie und Neuere Deutsche Literaturgeschichte an der Universität Würzburg, verwendet es regelmäßig für erste Recherchen. „Google Ngram Viewer ist ein bewundernswertes Werkzeug – bei allen methodischen Schwächen, die es noch hat“, sagt Jannidis. Pfiffige Instrumente zur wissenschaftlichen Textanalyse gebe es inzwischen aber auch in Deutschland, etwa die virtuelle Forschungsumgebung für Geistes- und Sozialwissenschaftler aus Trier oder das TextGrid aus Göttingen. Jannidis: „In Zukunft können wir mit weiteren Programmen dieser Art rechnen.“

Sind das alles die Vorboten einer Datenrevolution, wie sie Erez Aiden und Jean-Baptiste Michel vorhersagen? „Sie wird unser Selbstbild transformieren, die Geisteswissenschaften und Sozialwissenschaften grundlegend verändern und Wirtschaft und Elfenbeinturm dazu bringen, ihr Verhältnis neu auszutarieren“, schreiben die beiden in ihrem 2013 erschienenen Buch „Uncharted: Big Data as a Lens on Human Culture“. Die hyperventilierende Prophezeiung erinnert an die Marketingphrasen von Apple, Google und Co. Aber steckt vielleicht doch etwas Wahres darin? Ist die Digitalisierung der Kulturwissenschaften nicht sogar unausweichlich in einer zunehmend technisierten Welt? Und welche Folgen hat es, wenn sich Mathematiker und Techniker einmischen, wo bisher Intuition und Interpretation, Genie und Poesie walteten?

1320 exemplarische Werke deutschsprachiger Literatur stellt das Deutsche Textarchiv zum Download zur Verfügung.

„Digitalprojekte verschlingen Ressourcen, die wir dringend für unser Kerngeschäft bräuchten“, sagt Gerhard Wolf, Professor für Ältere Deutsche Philologie an der Universität Bayreuth. Zu den Kernaufgaben der Geisteswissenschaften zählt Wolf das interpretative Erforschen und Editieren von Texten, das forschende Lernen im Sinne der humboldtschen Idee der Universität. Für diese klassische Auslegung ließen sich die großen Förderorganisationen jedoch kaum noch begeistern, berichtet Wolf: „Da sitzen viele Naturwissenschaftler, die von den quantitativen, digitalen Methoden fasziniert sind.“

Was der Germanist und langjährige Vorsitzende des Philosophischen Fakultätentages offen anprangert, trauen sich weniger mutige Kollegen nur hinter vorgehaltener Hand zu sagen. Zu groß ist offenbar die Furcht, es sich mit den Geldgebern zu verderben. Doch die Kritik ist da und sie zielt in mehrere Richtungen: Statt an Fachwissenschaftler würden immer mehr Stellen an Techniker und Informatiker vergeben, nicht selten werde in unbrauchbare Programme investiert, die Langlebigkeit der Digitalisate sei nicht gewährleistet, und überhaupt nehme die Abhängigkeit von der Technik besorgniserregend zu.

Antike Autoren stehen im Fokus des Perseus-Projekts.
Antike Autoren stehen im Fokus
des Perseus-Projekts.

Screenshots: www.humboldt-foun-
dation.de

„Wir laufen Gefahr, in all den angehäuften Daten zu ersticken“, sagt Martin Hose von der Münchener Ludwig-Maximilians-Universität. Zwar befürwortet der Gräzist das digitale Konservieren kultureller Zeugnisse und ist selbst an entsprechenden Editionsprojekten beteiligt. Dass er digitale Primärdaten mit Gewinn für Forschung und Lehre nutzt, räumt der bayerische Wissenschaftler gern ein. Doch er warnt auch vor einem drohenden Verlust an Überblickswissen, das uns ermöglicht, Wichtiges von weniger Wichtigem zu unterscheiden. Ein Bild vom großen Ganzen entstehe oft beim Durcharbeiten von Büchern, doch so gut wie nie beim Googeln nach Schlagworten, sagt Martin Hose und fügt hinzu: „Ohne die geistige Infrastruktur wissen wir aber gar nicht, nach was wir suchen sollen.“ Die besten Antworten auf unsere Fragen könnten uns daher verborgen bleiben.

Antworten, wie sie zum Beispiel bei Sokrates, Euripides und Seneca zu finden sind. Deren Werke und die vieler anderer antiker Autoren hat der US-amerikanische Forscher Gregory Crane in einer riesigen Onlinebibliothek versammelt, der Perseus Digital Library. Sie enthält zahlreiche Instrumente zur Übersetzung der alten Schriften in moderne Sprachen und zur Untersuchung der Evolution und Verbreitung klassischer Ideen über die Jahrhunderte hinweg. Auch Crane ist ein Pionier der Digital Humanities, sein 1985 begonnenes Perseus-Projekt ein Aushängeschild der Bewegung. „I am a Weltbürger“, sagt der 56-jährige Amerikaner, der seit einem Jahr eine Alexander von Humboldt- Professur an der Universität Leipzig innehat. Sie sichert dem agilen Altphilologen mit fünf Millionen Euro eine für die Geisteswissenschaften außerordentlich hohe Fördersumme.

Das Bundesforschungsministerium fördert die e-Humanities von 2013 bis 2017 mit 19,5 Millionen Euro.

Nutzen will Crane das Geld, um ein europäisches Großprojekt voranzubringen: eine Internetplattform für Schüler, Studenten und andere, die antike Texte übersetzen und analysieren und sich dabei gegenseitig verbessern und inspirieren können. Geballte Schwarmintelligenz also, um die gemeinsamen Wurzeln zu stärken. Die Dimension des Vorhabens erläutert der US-Wissenschaftler an einem Beispiel: „In Deutschland gibt es 800 000 Lateinschüler, in Frankreich 500 000, in Italien zwei Millionen und Hunderttausende in anderen Ländern Europas – wenn nur zehn Prozent von ihnen mitmachten, wäre schon viel gewonnen.“

Gregory Crane und die Humboldt-Professur, das sei ein großer Schub für die digitale Idee hierzulande, sagt Jan Christoph Meister, Literaturwissenschaftler an der Universität Hamburg. Meister ist erster Vorsitzender des vor zwei Jahren gegründeten Fachverbandes Digital Humanities im deutschsprachigen Raum. Zur ersten Jahrestagung des Verbandes im März kamen mehr als 350 Teilnehmer; das sind fast so viele wie bei einem durchschnittlichen Germanistentag. Den Eröffnungsvortrag hielt John Nerbonne unter dem provokanten Titel „Die Informatik als Geisteswissenschaft“.

In den Geisteswissenschaften vollziehe sich gerade ein Kulturwandel, diagnostiziert Jan Christoph Meister: Neben den genialen Einzelforscher trete immer häufiger das interdisziplinäre Team. Da hat dann nicht automatisch der Ordinarius das Sagen, sondern auch einmal der Doktorand mit der pfiffigen Idee. „Ein Gutteil der Skepsis, die uns entgegenschlägt, hat mit der Angst vor einem möglichen Ansehensverlust zu tun“, sagt der Hamburger Germanist. Er schätzt, dass derzeit zehn Prozent der Geisteswissenschaftler in Deutschland in der neuen Bewegung aktiv sind und etwa fünf Prozent sich ausdrücklich dagegenstellen. „Mehr als 80 Prozent sind ein bisschen interessiert und warten ab, was passiert.“

aus Humboldt Kosmos 102/2014
Erez Lieberman Aiden und Jean-Baptiste Michel
Dr. Erez Lieberman Aiden & Dr. Jean-Baptiste Michel
Baylor College of Medicine, Harvard University, Google
Foto: Jessica Scranton

Den tieferen Sinn in Datenbergen erkennen – darum geht es dem US-Amerikaner Erez Aiden (links) und dem Franzosen Jean-Baptiste Michel (rechts). Dabei ist es nebensächlich, ob die Daten aus den Geisteswissenschaften oder der Biologie oder Astronomie stammen. Doch anders als in den Naturwissenschaften wird Data-Mining im Kulturbereich nur selten in großem Stil angewandt. Noch seltener schafft es eine Studie aus den Geisteswissenschaften auf die Titelseite des Wissenschaftsmagazins „Science“. Beides gelang Aiden und Michel vor drei Jahren. Mit ihrer Auswertung von Millionen Büchern begründeten sie Culturomics, eine Methode zum Aufspüren kultureller und sozialer Trends. Veröffentlichungen vom Kaliber dieser „Science“-Publikation hat es seither nicht mehr gegeben. Das mag auch daran liegen, dass Erez Aiden inzwischen Direktor des Center for Genome Architecture am Baylor College of Medicine im texanischen Houston, USA , ist. Er will herausfinden, wie die Erbsubstanz im Zellkern gefaltet ist. Sein Kollege Jean-Baptiste Michel, der sich Unternehmer, Künstler und Forscher nennt, pendelt weiter zwischen Harvard und Google.

Gerhard Wolf
Professor Dr. Gerhard Wolf
Universität Bayreuth
Foto: privat

Die zunehmende Digitalisierung der Geisteswissenschaften hat schädliche Folgen für Studenten, befürchtet der Bayreuther Germanistikprofessor Gerhard Wolf. Viele junge Leute könnten zwar hervorragend mit neuen Medien umgehen, sie seien jedoch kaum noch in der Lage, sich auf einen Text zu konzentrieren. „Viele Studenten fragen: Warum soll ich mir das einprägen, im Internet steht ja immer alles zur Verfügung“, berichtet Wolf. Er hatte im Jahr 2012 mit einer Erhebung zur Studierfähigkeit von Studenten geisteswissenschaftlicher Fächer bundesweit für Schlagzeilen gesorgt. Tatsächlich war das Ergebnis der Befragung von Professoren an 134 Philologischen Fakultäten alarmierend: Studienanfänger weisen demnach massive Lücken in Rechtschreibung, Interpunktion und Grammatik auf, ihr Wortschatz ist mager und das Leseverständnis mangelhaft. Der negative Trend halte ungebrochen an, berichtet Gerhard Wolf zwei Jahre später, und die Digital Humanities verstärkten ihn sogar.

Gregory Crane
Professor Dr. Gregory Crane
Universität Leipzig
Foto: Humboldt-Stiftung / Sven Müller

Seine Karriere zeugt von großer Beständigkeit: Seit 30 Jahren arbeitet Gregory Crane an einer frei zugänglichen Onlinebibliothek, die irgendwann einmal das Kulturerbe der Menschheit versammeln soll. Benannt ist das von einem Team um Crane initiierte Megaprojekt Perseus Digital Library nach einem Heros der griechischen Mythologie, einem Sohn des Zeus. Bis heute liegt der Schwerpunkt der Bibliothek auf Quellen der griechischen und römischen Antike, aber zunehmend werden auch Materialien aus anderen Epochen eingestellt. Die meisten Werke sind übersetzt, die Originaltexte sind zusätzlich einsehbar. Beheimatet ist das Perseus- Projekt an der Tufts University in Boston, Massachusetts, USA , wo der 1957 geborene Crane viele Jahre forschte und lehrte. Im Jahr 2012 wechselte er mit einer Alexander von Humboldt-Professur nach Leipzig. Die dortige Universität hat ihn nominiert, um ein Ziel zu erreichen: die Umwandlung ihres Informatikinstituts in ein Zentrum für Digital Humanities von Weltrang.

Jan Christoph Meister
Professor Dr. Jan Christoph Meister
Universität Hamburg
Foto: privat

Nach seiner Vision für die Digital Humanities gefragt, muss der Literaturwissenschaftler Jan Christoph Meister nicht lange nachdenken: „Mehrere Projektcluster mit einer Laufzeit von zehn Jahren, in denen Geisteswissenschaftler mit Kollegen aus der Informatik und der Kognitionsforschung zusammenarbeiten – das wäre ein Durchbruch.“ Die Kosten schätzt Meister auf rund 20 Millionen Euro. Im Unterschied zu Infrastrukturmaßnahmen werde die Arbeit an konkreten Forschungsfragen in dem neuen Gebiet noch zu zögerlich gefördert, kritisiert er und wünscht sich mehr Unterstützung von Wissenschaftsorganisationen und Stiftungen. Von 2010 bis 2013 war Meister Projektpartner im TransCoop-Programm der Humboldt-Stiftung.