Dokumentation der Annotationen

Annotationsebenen

Textebenen

edition
Die Ebene “edition” gibt den Text der zugrundeliegenden Edition wieder. Auf welcher Edition das jeweilige Subkorpus basiert, erfahren Sie in der Liste der enthaltenen Texte

text
Die Ebene “text” enthält eine normalisierte Annotation der Ebene “edition”. Die Normalisierung erfolgt ausschließlich graphematisch bei nicht-lemmakonformen Getrennt- oder Zusammenschreibungen (siehe Abbildung).

SelfHTML-Logo
Abbildung 1: Zusammenschreibung auf “text” von nicht-lemmakonformer Getrenntschreibung auf “edition”

SelfHTML-Logo
Abbildung 2: Getrenntschreibung auf “text” von nicht-lemmakonformer Zusammenschreibung auf “edition”

Lexikalische Ebenen

lemma
Die Ebene “lemma” enthält eine Zuweisung der Belege zu einem Lemma nach Splett (1993) zu. Lemmatisierungen nach anderen einschlägigen Wörterbüchern des Althochdeutschen sind durch Kürzel gekennzeichnet. Eine Liste aller verwendeten Wörterbücher können Sie unter Referenzen einsehen.

translation
Die Ebene “translation” enthält eine zum inhaltlichen Kontext des Lemmas passende Auswahl aus den bei Splett (1993) gegebenen Übersetzungsvorschlägen zum Lemma.

lang
Die Ebene “lang” enthält Annotationen der Sprache, der ein Beleg zugeordnet werden kann. Die Sprachen werden nach ISO 639 annotiert. Die Zuweisung eines Belegs zu einer Sprache richtete sich nach Angaben aus der Forschungsliteratur, Vorkommen in einschlägigen Wörterbüchern und anhand markanter phonologischer und morphologischer Merkmale. Eine Liste der im Korpus vorkommenden Sprachen entnehmen Sie bitte dem Tagset.

posLemma
Die Ebene “posLemma” enthält Annotationen der Wortartenzugehörigkeit der Lemmata (i.d.R nach Splett 1993). Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

Morphologische Ebenen

inflectionClassLemma
Die Ebene “inflectionClassLemma” enthält Annotationen der nominalen oder verbalen Flexionsklasse des Lemmas (i.d.R nach Splett 1993). Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

inflectionClass
Die Ebene “inflectionClass” enthält Annotationen der nominalen oder verbalen Flexionsklasse, die man von der morphologischen Beschaffenheit des auf “edition” annotierten Beleges ableiten kann. Auf “inflectionClass” wird nur annotiert, wenn der annotierte Beleg Anzeichen von Flexion aufweist oder einer flektierenden Wortart angehört. Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flexionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

inflection
Die Ebene “inflection” gibt die paradigmatischen Instanzen des annotierten Belegs wieder. Annotiert werden additiv und in fester Reihenfolge morphologische Kategorien der auf “pos” annotierten Wortart. Die Annotationen der Kategorien werden durch Unterstriche “_” getrennt

Annotation auf pos Erläuterung Reihenfolge der Kategorien
N. Nomina Appelativa, Eigennamen, Ortsnamen Numerus_Kasus
ADJ.\* attributive und prädikative Adjektive in unterschiedlicher Stellung zum Bezugsnomen Gradus_Genus_Numerus_Kasus_Paradigma
V.PP.\* und V.PS.\* Paritzipien Präteritum und Präsens Paradigma_Gradus_Genus_Numerus_Kasus_Paradigma
PPER Personalpronomina (Genus_)Numerus_Kasus_Person
D.\* Determinierende Pronomina Genus_Numerus_Kasus_Person
P.\* Substituierende Pronomina Genus_Numerus_Kasus_Paradigma

Beispiele:

  • stark flektiertes Partizip Präteritum
    gifulta
    P_POS_FEM_PL_NOM_ST
  • finites Verb
    uuarun
    IND_PAST_PL_3

Syntaktische Ebenen

clause
Die Ebene “clause” annotiert vollständige und unvollständige Satzspannen mit Informationen über die Finitheit, das Vorhandensein einleitender Elemente und die Satzart, Stellung im Satzgefüge bzw. den Satzgliedwert. Adverbialsätze werden auch semantisch bestimmt. Die Annotation erfolgt additiv, die einzelnen Tags sind durch Unterstriche getrennt und haben eine feste Reihenfolge. Die Tabelle zeigt die feste Reihenfolge der Instanzen, sowie eine Liste pro Instanz einsetzbarer Tags. Erläuterungen zu den Tags der Ebene “clause” finden Sie unter Tagsets.

Satzbildendes Element ggf. Unterbrechung / Wiederaufnahme eingeleitet / uneingeleitet Satzart, Satzgefüge, Satzgliedwert Semantische Klasse (bei Adverbialsätzen)
CF
CI
CP
CE
CS
CC
CX
I
U
M
S
O
Int
ID
Imp
Ex
Adv
Rel
Temp
Loc
Caus
Mod
Fin
Cnd
Cnc
Cns
Ad

Beispiele:

  • Uneingeleiteter Hauptsatz
    in anaginne was wort
    CF_U_M
  • Eingeleiteter kausaler Adverbialsatz
    bithiu uuanta im ni uuas ander stat in themo gasthuse
    CF_I_Adv_Caus

pos
Die Ebene “pos” enthält Annotationen der morphologisch-funktionalen Wortartenzugehörigkeit des Belegs. Sie enthält Informationen über Wortartenzugehörigkeit (V.* für ‘Verb’, N.* für ‘Nomina’), morphologische Form (“.*FIN” für “Finitum”), morpholgische Funktion (“VA.*” für ‘Hilfsverben’, “VM.*” für ‘Modalverben’), syntaktische Funktion (“.*S” für ‘eine Nominalphrase substituierend’) und syntaktische Stellung (“.*N” für ‘nachgestellt’). Die Annotationen sind auf der Grundlage des Belegs und seines Kontexts erstellt. Die pos-Tags entnehmen Sie bitte dem Tagset.

Textstrukturelle Ebenen

document
Die Ebene “document” enthält eine Spannenannotation aller Token, die zu einem Text gehören. Bei Einzeltexteditionen entspricht die Annotation der Bezeichnung des Subkorpus (z.B. “Otfrid: Evangelienbuch”, “Isidor”, “Tatian” ). Bei Textsammlungen (z.B. “Kleinere althochdeutsche Textdenkmäler”) entspricht die Annotation der Bezeichnung des Textes (z.B. “Alemannischer Glauben und Beichte”).

chapter
Die Ebene “chapter” enthält eine Spannenannotation des Kapitels oder einer vergleichbaren textuellen makrostrukturellen Einheit mit Angabe der Kapitelnummer (arabische Ziffer). Das Vorhandensein einer makrostrukturellen Einteilung in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “chapter” in einem Text oder Subkorpus.

verse
Die Ebene “verse” enthält Spannenannotationen einer Verszeile mit Angabe der Versnummer in arabischen Ziffern. Das Vorhandensein einer textuellen Einteilung in Verszeilen in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “verse”.