Textriesen und Textzwerge im Referenzkorpus Altdeutsch

Von Gohar Schnelle | August 24, 2020

Im Referenzkorpus Altdeutsch leben ‚Textriesen‘ und ‚Textzwerge‘ einträchtig nebeneinander. Anders als ausgewogene Korpora späterer Sprachstufen, zielt das ReA darauf ab, die textuelle Überlieferung der Epoche vollständig abzubilden. Als genuines Textkorpus ist es dabei von der strukturellen Einheit ‚Text‘ bestimmt und was einen ‚Text‘ bildet, ist eher eine praktische Angelegenheit:

Die großen Denkmäler wie Otfrids Evangelienbuch oder der Heliand liegen als eigenständige Subkorpora vor. Sie sind nach ihren makrostrukturellen Einheiten, wie z. B. der Kapitelgliederung, in einzelne ‚Texte‘ gegliedert, die in separaten ANNIS-Dokumenten vorliegen. Das größte dieser Dokumente, unser ‚Textriese‘, umfasst 4860 Textwörter und stammt aus Notkers Übersetzung des spätantiken Lehrbuchs ‚De nuptiis Philologiae et Mercurii‘. Es gibt aber auch die ‚Kleineren Althochdeutschen Denkmäler‘ und die ‚Kleineren Altsächsischen Denkmäler‘, die unsere ‚Textzwerge‘ enthalten, unter anderem:

  • einen in einen Vers gegossenen Seufzer eines geplagten Schreibers, hier in freierer Übersetzung: „Mit Mühe habe ich geschrieben, mit noch mehr Mühe gehofft, dass es bald zu Ende ist…“ (‚St. Galler Schreibervers‘)
  • eine Schmiererei in einem Buch „Gisela die Schöne las mich viel“ (‚Kicila-Vers‘)
  • und die traditionell als ‚Fuldaer Federprobe‘ bezeichnete Aussage „ich sandte zwei Gewänder und ein Bettlaken nach Thüringen“.

Das Referenzkorpus Altdeutsch umfasst in der Version 1.1 insgesamt 1620 Dokumente, von denen nur knapp 50 Texte 1000 Textwörter oder mehr lang sind. Gut ein Viertel der im Korpus enthaltenen Texte umfassen sogar nur 100 Textwörter oder weniger. Die Korpuslinguistik, die auf der Datengrundlage der Gegenwartssprachen entwickelt wurde, setzt methodisch an, dass eine valide empirische Grundlage aber erst ab ca. 2000 Textwörtern erreicht wäre (Neumann 2013; Biber 1990 und 1994). Für eine Sprachstufe, in der schriftliche Register und Strategien für die Formulierung längerer Texte erst den neuen kommunikativen Bedürfnissen entspringen, ist es nicht möglich, die ‚Textzwerge‘ von quantitativen Analysen auszuschließen. Sie sind nicht nur ein historisch-kulturelles Kuriosum, sie geben auch Einblick in die gesprochene Sprache, vervollständigen das Wissen über angewandte graphematische Strategien und erweitern allgemein das funktionale Varietätenspektrum der althochdeutschen Überlieferung über die schon stärker vertextlichten althochdeutschen Denkmäler hinaus. Das Philologenherz sehnt sich nach Vollständigkeit, die Korpuslinguistik strebt nach Ausgewogenheit.

In unserem ‚Textriesen‘ übrigens vermittelt Notker durch die Übersetzung des spätantiken Lehrbuchs damals moderne Wissenschaftsstandards. In dem allegorischen Werk des Martianus Capella heiratet der beredte Gott Merkur die hochgelehrte Philologia. Aus der Verbindung von Beredsamkeit und Gelehrtheit entspringen im Anschluss an die Hochzeit ausführliche Konzeptionen der sieben Freien Künste. Gut 1500 Jahre später verheiratet sich Philologia noch einmal: mit der Korpuslinguistik. Aus der Verbindung von Gelehrtheit und Methode entstehen auch diesmal neue Wissenschaftsstandards.

Belegstellen im Referenzkorpus

Zur Zählung aller ANNIS-Dokumente s. das Ergebniskästchen unter der Suchanfrage
Zur raumzeitlichen Verteilung großer und kleiner Texte: die chronografische Karte der ahd. Überlieferung
Notker
GSch
KV
FF

Literatur

  • Biber, Douglas (1990): Methodological Issues Regarding Corpus-based Analyses of Linguistic Variation. In: Literary and Linguistic Computing 5 (4), S. 257–269.
  • Biber, Douglas (1994): Representativeness in Corpus Design. In: Antonio Zampolli, Nicoletta Calzolari und Martha Palmer (Hg.): Current Issues in Computational Linguistics: In Honour of Don Walker. Dordrecht: Springer (Linguistica Computazionale, 9), S. 243–257.
  • Neumann, Stella (2013): Contrastive Register Variation. A Quantitative Approach to the Comparison of English and German. Berlin: de Gruyter (Trends in Linguistics. Studies and Monographs /TiLSM], 251). Online verfügbar

Abbildung: Kicila-Vers

Universitätsbibliothek Heidelberg Cod. Pal. lat. 52