Advanced sentiment analysis for understanding affective-aesthetic responses to literary texts: A computational and experimental psychology approach to children’s literature

Arthur Jacobs, Gerhard Lauer & Jana Lüdtke

Emotionale Beteiligung ist von entscheidender Bedeutung, wenn Kinder lernen, Geschichten zu lesen, zu erzählen und zu teilen. Diese Dimension kultureller Kompetenz hat in den Literaturwissenschaften, der Psychologie und den digitalen Geisteswissenschaften erstaunlich wenig Aufmerksamkeit erhalten. Eine vielversprechende Methode, um emotionale Informationen in Kinderlektüre zu bewerten, ist die Sentimentanalyse. Sie ermöglicht die Analyse größerer Textkorpora, um emotionale Muster zu finden, die potenziell die affektiv-ästhetischen Reaktionen junger Leserinnen und Leser auf literarische Texte steuern - auf Figuren, Ereignisse, Erzähler/Stimme und Gedichtzeilen. Standardwerkzeuge zur Stimmungsanalyse wurden jedoch im (industrienahen) Rahmen des Opinion Mining entwickelt. Dabei wurden psychologische Konzepte und Theorien der Emotionen wenig berücksichtigt. Sentimentanalyse muss daher an den literarischen Diskurs erst noch angepasst werden. Das ist Aufgabe und Herausforderung des CHYLSA-Projekts.In dem Folgeantrag CHYLSA II entwickeln wir fortgeschrittene Sentiment-Analysen für den Einsatz in der computergestützten Literaturwissenschaft im Allgemeinen und für Kinder- und Jugendliteratur im Besonderen. In Fortsetzung des CHYLSA I arbeiten wir weiter an der Finalisierung und Veröffentlichung der Korpora, entwickeln das Sentiment-Analyse-Tool 'SentiArt' weiter und führen eine Kreuzvalidierung der Emotionsvorhersage durch Maschinen und Menschen durch. 1) Im Gegensatz zu CHYLSA I beschränken wir uns auf Korpora von Kinder- und Jugendbüchern und Texten, die heute viel gelesen werden, aber wir schließen keine historischen Texte mehr ein, die heute nicht mehr gelesen werden. Statt der historisch gewordenen Texte erstellen wir eine Auswahl der bereits gesammelten Texte in ‚leichter Sprache‘. Eine Parallelversion in vereinfachtem Deutsch gibt Aufschluss darüber, wie der Faktor Komplexität die Leistung der Sentimentanalyse beeinflusst. Außerdem bereiten wir die Korpora (als Trainingssätze und als Datenbank für die experimentelle Nutzung) so auf, dass sie nach dem FAIR-Prinzip innerhalb der NFDI Text+ öffentlich zugänglich sind. 2) Wir validieren und passen das Sentiment-Analyse-Tool 'SentiArt' an, indem wir weitere Trainingssätze annotieren, das Skript verbessern und in emotionspsychologischen Experimenten mit Kindern die maschinellen Voraussagen validieren. Zusätzlich zu CHYLSA I integrieren wir nun Aspekt-orientierte Transformer-Modelle, um die Beziehung zwischen Emotionen und Aspekten bei der Entwicklung des Sentiment-Analyse-Tools zu verstehen. 3) Wir testen die Validität des Tools über die Vorhersage des Leseverhaltens von Kindern. Zusätzlich zu CHYLSA I nehmen wir nun auch die Textkomplexität als eine der Hauptdimensionen in den Test auf. Wir hoffen, dass die COVD-19-Pandemie zu einer endemischen Situation wird und dass nun Experimente speziell mit Kindern einfacher durchzuführen sind und haben eine entsprechende Online-Testumgebung aufgebaut.

-->