Joachim Denzler & Sophie Marshall
Das Projekt nimmt sich die quantitative Analyse von rhetorischen Stilmitteln vor und entwickelt zu diesem Zweck neue distant reading-Tools. Ziel ist die vergleichende Untersuchung dreier mittelalterlicher Erzählgattungen, nämlich der mittelhochdeutschen Adaptationen der trois matières. Differenzkriterium zwischen Antikenroman, Artusroman und chanson de geste-Epik des 12. und 13. Jahrhunderts ist für die mediävistische Forschung bislang der Inhalt. Ob sich messbare Gemeinsamkeiten und Unterschiede dieser Gattungen auf Ebene des rhetorischen Stils finden lassen, wurde übergreifend nie untersucht. Für die kontroverse Diskussion über den Grad an Gattungsbewusstsein mittelalterlicher Autoren und über mittelalterliche Gattungskonzepte wäre eine solche Untersuchung ebenso erhellend wie für die Frage, welche Relevanz die im mittelalterlichen Schulunterricht gelernten rhetorischen Stilmittel für die Praxis volkssprachiger Dichtung besaßen. Zu überprüfen ist, ob Auswahl, Einsatz und Häufung der spezifischen Stilmittel Szenentypenabhängig sind und ob es dabei (näher zu bestimmende) Unterschiede der jeweiligen Gattungen oder nur der einzelnen Autoren oder der Entstehungszeiten der Werke gibt. Eine derartige, großflächige Analyse erfordert computationelle Werkzeuge des distant reading, die aber für die Erkennung der meisten Stilmittel – erst recht für mittelhochdeutsche Literatur – noch unterentwickelt sind. Zu diesem Zweck erarbeitet das Projekt neue Methoden stilometrischer Literaturuntersuchung und baut dabei auf Verfahren der Anomalie-Detektion und des aktiven und lebenslangen maschinellen Lernens auf. Denn Stilmittel lassen sich als Anomalien verstehen und für ein statistisches Verfahren als solche erkennbar machen, als Abweichungen also von der quantitativen Norm, wie sie das Gros des Textkorpus abbildet (so ist z. B. ein Chiasmus im Rahmen meist nicht-chiastischer Strukturen eine Anomalie). Um zeitraubende händische Annotation zu minimieren, bedient sich das Projekt Techniken des active and lifelong learning; angestrebt wird dabei ein halbüberwachtes Lernverfahren, indem zunächst das Programm unüberwacht Anomalien lokalisiert und sich sodann in einem interaktiven Prozess unter stetiger Einbeziehung des Nutzers durch sukzessive Integration theoretischen Strukturwissens oder kleiner annotierter Datenproben verfeinert, sodass spezifische Stilmittel besser erkannt werden. Exemplarisch sollen so zwei Stilmittel – eine Wortstellungsfigur und eine Trope – computationell identifizierbar gemacht werden: neben dem Chiasmus die Metapher, die durch das ungewöhnliche Zusammenspiel von z. B. in word-embeddings reflektierten Wortbedeutungen ebenfalls als Anomalie charakterisierbar ist. Die am Neuhochdeutschen trainierten wordembeddings sollen schließlich für die mittelhochdeutsche Literatur kompatibel gemacht werden.