Korpusbeschreibung

Das Referenzkorpus Altdeutsch erfasst und annotiert sämtliche althochdeutschen und altniederdeutschen Texte (ca. 750 – 1050 u.Z.). Nach Abschluss der Arbeiten wird das Korpus etwa 650 000 Wörter umfassen.

Die Grundlage für das Korpus bilden als Referenztexte die handschriftengetreuesten gedruckten Texteditionen, soweit diese zugänglich sind. Alle Wortformen werden sowohl auf der Wortebene als auch auf der Buchstabenebene aufgenommen. Neben den Formen der Editionen werden die Schreibweise der Handschriften ebenso wie einheitlich standardisierte Wortformen in das Korpus aufgenommen. Graphische Besonderheiten wie z.B. Rubrizierung in den Manuskripten, Kursivierung, in den Editionen aufgelöste Diakritika oder Ligaturen werden im Korpus kommentiert.

Alle Wortformen sind lemmatisiert. Die linguistische Annotation umfasst die Wortarten, morphologische Informationen und Angaben zu den Sätzen, des Weiteren werden Zeilenumbrüche, Absätze und andere Mittel zur Textgliederung ebenso wie Angaben zu Versgliederung und Reimpositionen, soweit vorhanden, erfasst.

Alle in die Datenbank aufgenommenen Texte sind mit Header-Informationen versehen, die die sprach- und literaturwissenschaftlich relevanten Informationen zum jeweiligen Text wie z.B. Entstehungszeit, sprachlicher Raum und Überlieferungskontext enthalten.

Bei Fragen wenden Sie sich gerne an uns: Kontakt.