Annotationsebenen
Textebenen
edition
Die Ebene “edition” gibt den Text der zugrundeliegenden Edition wieder. Auf welcher Edition das jeweilige Subkorpus basiert, erfahren Sie in der Liste der enthaltenen Texte
text
Die Ebene “text” enthält eine normalisierte Annotation der Ebene “edition”. Die Normalisierung erfolgt ausschließlich graphematisch bei nicht-lemmakonformen Getrennt- oder Zusammenschreibungen (siehe Abbildung).
Lexikalische Ebenen
lemma
Die Ebene “lemma” enthält eine Zuweisung der Belege zu einem Lemma nach Splett (1993) zu. Lemmatisierungen nach anderen einschlägigen Wörterbüchern des Althochdeutschen sind durch Kürzel gekennzeichnet. Eine Liste aller verwendeten Wörterbücher können Sie unter Referenzen einsehen.
translation
Die Ebene “translation” enthält eine zum inhaltlichen Kontext des Lemmas passende Auswahl aus den bei Splett (1993) gegebenen Übersetzungsvorschlägen zum Lemma.
lang
Die Ebene “lang” enthält Annotationen der Sprache, der ein Beleg zugeordnet werden kann. Die Sprachen werden nach ISO 639 annotiert. Die Zuweisung eines Belegs zu einer Sprache richtete sich nach Angaben aus der Forschungsliteratur, Vorkommen in einschlägigen Wörterbüchern und anhand markanter phonologischer und morphologischer Merkmale. Eine Liste der im Korpus vorkommenden Sprachen entnehmen Sie bitte dem Tagset.
posLemma
Die Ebene “posLemma” enthält Annotationen der Wortartenzugehörigkeit der Lemmata (i.d.R nach Splett 1993). Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.
Morphologische Ebenen
inflectionClassLemma
Die Ebene “inflectionClassLemma” enthält Annotationen der nominalen oder verbalen Flexionsklasse des Lemmas (i.d.R nach Splett 1993). Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.
inflectionClass
Die Ebene “inflectionClass” enthält Annotationen der nominalen oder verbalen Flexionsklasse, die man von der morphologischen Beschaffenheit des auf “edition” annotierten Beleges ableiten kann. Auf “inflectionClass” wird nur annotiert, wenn der annotierte Beleg Anzeichen von Flexion aufweist oder einer flektierenden Wortart angehört. Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.
inflection
Die Ebene “inflection” gibt die paradigmatischen Instanzen des annotierten Belegs wieder. Annotiert werden additiv und in fester Reihenfolge morphologische Kategorien der auf “pos” annotierten Wortart. Die Annotationen der Kategorien werden durch Unterstriche “_” getrennt
Annotation auf pos | Erläuterung | Reihenfolge der Kategorien |
---|---|---|
N. | Nomina Appelativa, Eigennamen, Ortsnamen | Numerus_Kasus |
ADJ.\* | attributive und prädikative Adjektive in unterschiedlicher Stellung zum Bezugsnomen | Gradus_Genus_Numerus_Kasus_Paradigma |
V.PP.\* und V.PS.\* | Paritzipien Präteritum und Präsens | Paradigma_Gradus_Genus_Numerus_Kasus_Paradigma |
PPER | Personalpronomina | (Genus_)Numerus_Kasus_Person |
D.\* | Determinierende Pronomina | Genus_Numerus_Kasus_Person |
P.\* | Substituierende Pronomina | Genus_Numerus_Kasus_Paradigma |
Beispiele:
- stark flektiertes Partizip Präteritum
gifulta
P_POS_FEM_PL_NOM_ST
- finites Verb
uuarun
IND_PAST_PL_3
Syntaktische Ebenen
clause
Die Ebene “clause” annotiert vollständige und unvollständige Satzspannen mit Informationen über die Finitheit, das Vorhandensein einleitender Elemente und die Satzart, Stellung im Satzgefüge bzw. den Satzgliedwert. Adverbialsätze werden auch semantisch bestimmt. Die Annotation erfolgt additiv, die einzelnen Tags sind durch Unterstriche getrennt und haben eine feste Reihenfolge. Die Tabelle zeigt die feste Reihenfolge der Instanzen, sowie eine Liste pro Instanz einsetzbarer Tags. Erläuterungen zu den Tags der Ebene “clause” finden Sie unter Tagsets.
Satzbildendes Element | ggf. Unterbrechung / Wiederaufnahme | eingeleitet / uneingeleitet | Satzart, Satzgefüge, Satzgliedwert | Semantische Klasse (bei Adverbialsätzen) |
CF CI CP CE |
CS CC CX |
I U |
M S O Int ID Imp Ex Adv Rel |
Temp Loc Caus Mod Fin Cnd Cnc Cns Ad |
Beispiele:
- Uneingeleiteter Hauptsatz
in anaginne was wort
CF_U_M
- Eingeleiteter kausaler Adverbialsatz
bithiu uuanta im ni uuas ander stat in themo gasthuse
CF_I_Adv_Caus
pos
Die Ebene “pos” enthält Annotationen der morphologisch-funktionalen Wortartenzugehörigkeit des Belegs. Sie enthält Informationen über Wortartenzugehörigkeit (V.* für ‘Verb’, N.* für ‘Nomina’), morphologische Form (“.*FIN” für “Finitum”), morpholgische Funktion (“VA.*” für ‘Hilfsverben’, “VM.*” für ‘Modalverben’), syntaktische Funktion (“.*S” für ‘eine Nominalphrase substituierend’) und syntaktische Stellung (“.*N” für ‘nachgestellt’). Die Annotationen sind auf der Grundlage des Belegs und seines Kontexts erstellt. Die pos-Tags entnehmen Sie bitte dem Tagset.
Textstrukturelle Ebenen
document
Die Ebene “document” enthält eine Spannenannotation aller Token, die zu einem Text gehören. Bei Einzeltexteditionen entspricht die Annotation der Bezeichnung des Subkorpus (z.B. “Otfrid: Evangelienbuch”, “Isidor”, “Tatian” ). Bei Textsammlungen (z.B. “Kleinere althochdeutsche Textdenkmäler”) entspricht die Annotation der Bezeichnung des Textes (z.B. “Alemannischer Glauben und Beichte”).
chapter
Die Ebene “chapter” enthält eine Spannenannotation des Kapitels oder einer vergleichbaren textuellen makrostrukturellen Einheit mit Angabe der Kapitelnummer (arabische Ziffer). Das Vorhandensein einer makrostrukturellen Einteilung in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “chapter” in einem Text oder Subkorpus.
verse
Die Ebene “verse” enthält Spannenannotationen einer Verszeile mit Angabe der Versnummer in arabischen Ziffern. Das Vorhandensein einer textuellen Einteilung in Verszeilen in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “verse”.