Dokumentation der Annotationen

Annotationsebenen

Textebenen

edition
Die Ebene “edition” gibt den Text der zugrundeliegenden Edition wieder. Auf welcher Edition das jeweilige Subkorpus basiert, erfahren Sie in der Liste der enthaltenen Texte

text
Die Ebene “text” enthält eine normalisierte Annotation der Ebene “edition”. Die Normalisierung erfolgt ausschließlich graphematisch bei nicht-lemmakonformen Getrennt- oder Zusammenschreibungen (siehe Abbildung).

SelfHTML-Logo
Abbildung 1:Zusammenschreibung auf “text” von nicht-lemmakonformer Getrenntschreibung auf “edition”

SelfHTML-Logo
Abbildung 2: Getrenntschreibung auf “text” von nicht-lemmakonformer Zusammenschreibung auf “edition”

Lexikalische Ebenen

lemma
Die Ebene “lemma” enthält eine Zuweisung der Belege zu einem Lemma nach Splett (1993) zu. Lemmatisierungen nach anderen einschlägigen Wörterbüchern des Althochdeutschen sind durch Kürzel gekennzeichnet. Eine Liste aller verwendeten Wörterbücher können Sie unter Referenzen einsehen.

translation
Die Ebene “translation” enthält eine zum inhaltlichen Kontext des Lemmas passende Auswahl aus den bei Splett (1993) gegebenen Übersetzungsvorschlägen zum Lemma.

lang
Die Ebene “lang” enthält Annotationen der Sprache, der ein Beleg zugeordnet werden kann. Die Sprachen werden nach ISO 639 annotiert. Die Zuweisung eines Belegs zu einer Sprache richtete sich nach Angaben aus der Forschungsliteratur, Vorkommen in einschlägigen Wörterbüchern und anhand markanter phonologischer und morphologischer Merkmale. Eine Liste der im Korpus vorkommenden Sprachen entnehmen Sie bitte dem Tagset.

posLemma
Die Ebene “posLemma” enthält Annotationen der Wortartenzugehörigkeit der Lemmata (i.d.R nach Splett 1993). Die für die jeweiligen Flektionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

Morphologische Ebenen

inflectionClassLemma
Die Ebene “inflectionClassLemma” enthält Annotationen der nominalen oder verbalen Flektionsklasse des Lemmas (i.d.R nach Splett 1993). Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flektionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

inflectionClass
Die Ebene “inflectionClass” enthält Annotationen der nominalen oder verbalen Flektionsklasse, die man von der morphologischen Beschaffenheit des auf “edition” annotierten Beleges ableiten kann. Auf “inflectionClass” wird nur annotiert, wenn der annotierte Beleg Anzeichen von Flektion aufweist oder einer flektierenden Wortart angehört. Die Annotation auf der Ebene “inflectionClass” kann bei ein und demselben Beleg aufgrund von synchroner oder diachroner Variation von der Annotation auf “inflectionClassLemma” abweichen. Die für die jeweiligen Flektionsklassen verwendeten Tags entnehmen Sie bitte dem Tagset.

inflection
Die Ebene “inflection” gibt die paradigmatischen Instanzen des annotierten Belegs wieder. Annotiert werden additiv und in fester Reihenfolge morphologische Kategorien der auf “pos” annotierten Wortart. Die Annotationen der Kategorien werden durch Unterstriche “_” getrennt

Annotation auf pos Erläuterung “Reihenfolge der Kategorien”
N. Nomina Appelativa, Eigennamen, Ortsnamen Numerus_Kasus
ADJ.* attributive und prädikative Adjektive in unterschiedlicher Stellung zum Bezugsnomen Gradus_Genus_Numerus_Kasus_Paradigma
V.PP.* und V.PS.* Paritzipien Präteritum und Präsens Paradigma_Gradus_Genus_Numerus_KasusParadigma
PPER Personalpronomina (Genus)Numerus_Kasus_Person
D.* Determinierende Pronomina Genus_Numerus_Kasus_Person
P.* Substituierende Pronomina Genus_Numerus_Kasus_Paradigma

Beispiele:

  • stark flektiertes Partizip Präteritum
    gifulta
    P_POS_FEM_PL_NOM_ST
  • finites Verb
    uuarun
    IND_PAST_PL_3

Syntaktische Ebenen

clause
Die Ebene “clause” annotiert vollständige und unvollständige Clauses in einer Spanne. Die Annotation beinhaltet Informationen über Finitheit, Vorhandensein einleitender ELemente, Satzgliedstatus und Semantik des Clauses. Die Annotation erfolgt additiv, die einzelnen Tags sind durch Unterstriche getrennt und haben eine feste Reihenfolge. Je nach Satztyp sind die einzelnen Annotationen obligatorisch oder optional. Die Tabelle zeigt die feste Reihenfolge der Instanzen, sowie eine Liste pro Instanz einsetzbarer Tags. Erläuterungen zu den Tags der Ebene “clause” finden Sie unter Tagsets

Clause bildendes Element (Unterbrechung/Wiederaufnahme) Vorhandensein eines einleitenden Elements Satzgliedstatus Semantische Spezifizierung (bei Adverbialsätzen)
CF
CI
CP
CE
CS
CC
I
U
M
S
O
Att
Int
ID
Imp
Ex
Adv
Temp
Loc
Caus
Mod
Fin
Cnd
Cnc
Cns
Ad

Beispiele:

  • Uneingeleiteter Hauptsatz
    in anaginne was wort
    CF_U_M
  • Eingeleiteter kausaler Adverbialsatz
    bithiu uuanta im ni uuas ander stat in themo gasthuse
    CF_I_Adv_Caus

pos
Die Ebene “pos” enthält Annotationen der morphologisch-funktionalen Wortartenzugehörigkeit des Belegs. Sie enthält Informationen über Wortartenzugehörigkeit (V.* für ‘Verb’, N.* für ‘Nomina’), morphologische Form (“.*FIN” für “Finitum”), morpholgische Funktion (“VA.*” für ‘Hilfsverben’, “VM.*” für ‘Modalverben’), syntaktische Funktion (“.*S” für ‘eine Nominalphrase substituierend’) und syntaktische Stellung (“.*N” für ‘nachgestellt’). Die Annotationen sind auf der Grundlage des Belegs und seines Kontexts erstellt. Die pos-Tags entnehmen Sie bitte dem Tagset.

Textstrukturelle Ebenen

document
Die Ebene “document” enthält eine Spannenannotation aller Token, die zu einem Text gehören. Bei Einzeltexteditionen entspricht die Annotation der Bezeichnung des Subkorpus (z.B. “Otfrid: Evangelienbuch”, “Isidor”, “Tatian” ). Bei Textsammlungen (z.B. “Kleinere althochdeutsche Textdenkmäler”) entspricht die Annotation der Bezeichnung des Textes (z.B. “Alemannischer Glauben und Beichte”).

chapter
Die Ebene “chapter” enthält eine Spannenannotation des Kapitels oder einer vergleichbaren textuellen makrostrukturellen Einheit mit Angabe der Kapitelnummer (arabische Ziffer). Das Vorhandensein einer makrostrukturellen Einteilung in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “chapter” in einem Text oder Subkorpus.

verse
Die Ebene “verse” enthält Spannenannotationen einer Verszeile mit Angabe der Versnummer in arabischen Ziffern. Das Vorhandensein einer textuellen Einteilung in Verszeilen in der zugrundeliegenden Edition ist Voraussetzung für das Vorhandensein der Ebene “verse”.