Projektbeschreibung

Mit der Initiative "Deutsch Diachron Digital" wurde über viele Jahre das Ziel verfolgt, für die Erforschung der Sprachgeschichte des Deutschen tiefenannotierte Korpora auf der Höhe der technologischen Entwicklung zu erstellen. Sie sollten die empirische Grundlage der sprachhistorischen Forschung verbreitern und kostenfrei öffentlich verfügbar sein. Angesichts der Spezifika der zu annotierenden Sprachstufen und der Menge zu annotierender Daten wurde dann die Korpuserstellung nach Sprachstufen getrennt in eigenständigen Projekten verwirklicht, so dass heute ein Verbund aus vier Referenzkorpora existiert:

Referenzkorpus Altdeutsch (Berlin, Frankfurt, Jena) – Referenzkorpus Mittelhochdeutsch (Bonn, Bochum) – Referenzkorpus Frühneuhochdeutsch (Bochum, Halle, Potsdam) – Referenzkorpus Mittelniederdeutsch/Niederrheinisch (Hamburg, Münster) – Referenzkorpus Deutscher Inschriften (Bochum, Mainz). Eine Fortführung der Verbundideen in einem Referenzkorpus des Neuhochdeutschen ist nun auch durch das Projekt GiesKaNe gegeben.
Die Korpora sind in ihrer Entstehungsgeschichte eng verbunden, verfolgen in der Korpuskonzeption, den Annotationsmodellen sowie den Abfrage- und Visualisierungsmöglichkeiten gemeinsame Ziele. Sie sind aber auch in ihren Nutzungsszenarien sowie ihren Entwicklungsperspektiven verbunden und stehen weiterhin in enger Kooperation.
Payment unter der Leitung von Prof. Dr. Karin Donhauser
Sonja Linde, Julia Richling, Dr. Tom Ruette, Silke Unverzagt
Daniel Brauer, René Czeszinski, Anne Kannacher, Martin Klotz, Gohar Kodshajew, Annerose Schultz, Carolin Odebrecht, Juliane Thiemann
Payment
unter der Leitung von Prof. Dr. Jost Gippert
Roland Mittmann
Daniel Krauße, Nikolaus Neagu, Johannes Heimeroth, Franziska Hüther, Michael Westphal

Payment unter der Leitung von Prof. Dr. Rosemarie Lühr
Ulrike Ertel, Anna Möller, Natalia Mull
Ulrich Geupel, Francis Gieseke, Bernhard Luxner, John Reichelt, Laura Sturm
Die Erarbeitung des 'Referenzkorpus Altdeutsch (750-1050)' wurde von 2008 bis 2015 durch die Deutsche Forschungsgemeinschaft im Programm der DFG-Sachbeihilfen gefördert. Die Projektarbeit erfolgte in Berlin, Frankfurt und Jena.

In dieser Zeit wurde das Referenzkorpus als innovative Forschungsressource inhaltlich und technisch realisiert. In der ersten Projektphase (2009-2011) wurden die kleineren Sprachdenkmäler des Althochdeutschen und Altsächsischen bearbeitet sowie die größeren Texte des späten 8. und 9. Jahrhunderts (Isidor, Tatian, Ofrid und Heliand). In der 2. Projektphase folgte die Bearbeitung vor allem des Gesamtwerks Notkers von St. Gallen aus der 1. Hälfte des 11. Jahrhunderts, das vom Umfang her mit ca. 350 000 Wortformen mehr als die Hälfte der altdeutschen Textüberlieferung ausmacht.

Seit der Veröffentlichung der ersten vollständigen Version 'v1.0' steht das Referenzkorpus Altdeutsch kostenfrei, ohne Anmeldung und browserbasiert für weiterführende Forschungsprogramme zur Verfügung. Es enthält eine auf Vollständigkeit bedachte annotierte Sammlung der ältesten deutschen Sprachdenkmäler vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. einer halben Million Textwörtern.

Payment unter der Leitung von Prof. Dr. Karin Donhauser
Dr. Lars Erik Zeige, Gohar Schnelle
Nico Friesenhan, Martin Klotz
Payment
unter der Leitung von Prof. Dr. Jost Gippert
Dr. Roland Mittmann, Dr. Ralf Plate

Nach dem Auslaufen des DFG-geförderten Projekts wird das Korpus an der Humboldt-Universität zu Berlin und der Goethe-Universität Frankfurt am Main aus Bordmitteln weiterentwickelt und betrieben mit dem Ziel, die Forschungsressource entlang aktueller sprachhistorischer und korpuslinguistischer Entwicklungen zu erweitern und ihren nachhaltigen Einsatz sicherzustellen.

Gegenwärtig erarbeiten wir die strategischen Entwicklungspläne 'Plan 2.0' (u.a. Alignierung der althochdeutsch-lateinischen Paralleltexte) sowie 'Plan 3.0' (u.a. syntaktische Annotation jenseits der Satzspannen) und greifen dabei auch auf die Koordination mit den Korpora und den korpuslinguistischen Partnern der DDD-Initiative zurück.

Zum Entwicklungskonzept gehören auch neue Anwendungsszenarien für die umfänglichen Daten des Referenzkorpus. Mit der Erstellung des 'Lesekorpus Altdeutsch' am Standort Frankfurt am Main wurde zum Beispiel die philologisch orientierte Nutzung der Korpusdaten verbessert und beim Lehrstuhlprojekt der 'Chronografischen Karten' in Berlin stehen Visualisierungs- und Unterrichtskonzepte für sprachhistorische Variationsdaten im Vordergrund.

22.06.2018: Release: Die Version 1.1 des Referenzkorpus Altdeutsch ist verfügbar und online.

20.03.2018: Vorankündigung: Die Version 1.1 des Referenzkorpus Altdeutsch wird in Bälde erscheinen.

01.01.2017: Release: Die Version 1.0 des Referenzkorpus Altdeutsch ist verfügbar und online.

01.05.2013: Viele Korpora sind mittlerweile mit ANNIS durchsuchbar.

16.10.2012: Neue Versionen vom Tatian und den kleineren althochdeutschen Textdenkmälern wurden online gestellt.

25.7.2012: Der Tatian ist nun auch in der lateinischen Original-Fassung durchsuchbar.

25.6.2012: Der Althochdeutsche Tatian ist in ANNIS verfügbar.

22.6.2012: Die Metadaten der bearbeiteten Texte sind in der Dokumentation abrufbar.

18.4.2012: 43 Texte der kleineren althochdeutschen Textdenkmäler können in ANNIS durchsucht werden.

Ein Publikationsverzeichnis finden Sie hier.

Über uns

Die Webseite deutschdiachrondigital.de wird betrieben vom Lehrstuhl für Geschichte der deutschen Sprache der Humboldt-Universität zu Berlin.

Kontakt

Humboldt-Universität zu Berlin
Geschichte der deutschen Sprache
Unter den Linden 6
10099 Berlin
www.sprachgeschichte.de

Zur Kontaktseite