Projektbeschreibung

Mit der Initiative "Deutsch Diachron Digital" wurde etwa ab der Jahrtausendwende das Ziel verfolgt, für die Erforschung der Sprachgeschichte des Deutschen tiefenannotierte Korpora auf der Höhe der technologischen Entwicklung zu erstellen. Sie sollten die empirische Grundlage der sprachhistorischen Forschung verbreitern und kostenfrei öffentlich verfügbar sein. Angesichts der Spezifika der zu annotierenden Sprachstufen und der Menge zu annotierender Daten wurde dann die Korpuserstellung nach Sprachstufen getrennt in eigenständigen Projekten verwirklicht, so dass heute ein Verbund aus mehreren Referenzkorpora existiert:

Referenzkorpus Altdeutsch (Berlin, Frankfurt, Jena) – Referenzkorpus Mittelhochdeutsch (Bonn, Bochum) – Referenzkorpus Frühneuhochdeutsch (Bochum, Halle, Potsdam) – Referenzkorpus Mittelniederdeutsch/Niederrheinisch (Hamburg, Münster) – Referenzkorpus Deutscher Inschriften (Bochum, Mainz). Eine Fortführung der Verbundideen in einem Referenzkorpus des Neuhochdeutschen ist nun auch durch das Projekt GiesKaNe gegeben.
Die Korpora sind in ihrer Entstehungsgeschichte eng verbunden, verfolgen in der Korpuskonzeption, den Annotationsmodellen sowie den Abfrage- und Visualisierungsmöglichkeiten gemeinsame Ziele. Sie sind aber auch in ihren Nutzungsszenarien für die linguistische und textbasierte Forschung, die akademische und schulische Ausbildung sowie für interessierte Laien verbunden. Die Verantwortlichen der Referenzkorpora stehen weiterhin in enger Kooperation und entwickeln als 'DDD-Verbund' gemeinsam neue Projekte, um die Ressourcen den sich ändernden Nutzungsszenarien und technologischen Entwicklungen anzupassen.
Payment unter der Leitung von Prof. Dr. Karin Donhauser
Sonja Linde, Julia Richling, Dr. Tom Ruette, Silke Unverzagt
Daniel Brauer, René Czeszinski, Anne Kannacher, Martin Klotz, Gohar Kodshajew, Annerose Schultz, Carolin Odebrecht, Juliane Thiemann
Payment
unter der Leitung von Prof. Dr. Jost Gippert
Roland Mittmann
Daniel Krauße, Nikolaus Neagu, Johannes Heimeroth, Franziska Hüther, Michael Westphal

Payment unter der Leitung von Prof. Dr. Rosemarie Lühr
Ulrike Ertel, Anna Möller, Natalia Mull, Roland Schuhmann
Ulrich Geupel, Francis Gieseke, Bernhard Luxner, John Reichelt, Laura Sturm
Die Erarbeitung des 'Referenzkorpus Altdeutsch (750-1050)' wurde von 2008 bis 2015 durch die Deutsche Forschungsgemeinschaft im Programm der DFG-Sachbeihilfen gefördert. Die Projektarbeit erfolgte in Berlin, Frankfurt und Jena.

In dieser Zeit wurde das Referenzkorpus als innovative Forschungsressource inhaltlich und technisch realisiert. In der ersten Projektphase (2009-2011) wurden die kleineren Sprachdenkmäler des Althochdeutschen und Altsächsischen bearbeitet sowie die größeren Texte des späten 8. und 9. Jahrhunderts (Isidor, Tatian, Ofrid und Heliand). In der 2. Projektphase folgte die Bearbeitung vor allem des Gesamtwerks Notkers von St. Gallen aus der 1. Hälfte des 11. Jahrhunderts, das vom Umfang her mit ca. 350 000 Wortformen mehr als die Hälfte der altdeutschen Textüberlieferung ausmacht.

Seit der Veröffentlichung der ersten vollständigen Version 'v1.0' steht das Referenzkorpus Altdeutsch kostenfrei, ohne Anmeldung und browserbasiert für weiterführende Forschungsprogramme zur Verfügung. Es enthält eine auf Vollständigkeit bedachte annotierte Sammlung der ältesten deutschen Sprachdenkmäler vom Beginn der kontinuierlichen schriftlichen Überlieferung um 750 bis etwa 1050 mit einem Umfang von ca. einer halben Million Textwörtern.

Logo HU unter der Leitung von PD Dr. Lars Erik Zeige
Gohar Schnelle, Martin Klotz
Stephanie Jandt
Nach dem Auslaufen des DFG-geförderten Projekts wird das Korpus an der Humboldt-Universität zu Berlin aus Bordmitteln weiterentwickelt und betrieben (bis 2020 zusammen mit der Goethe-Universität Frankfurt am Main). Ziel ist, die Forschungsressource entlang aktueller sprachhistorischer und korpuslinguistischer Forschungsparadigmen zu erweitern und ihren nachhaltigen Einsatz sicherzustellen.

Die einzelnen Entwicklungsschritte werden in strategischen Entwicklungsplänen erarbeitet und umgesetzt. Zunächst konnte mit dem 'Plan 1.2' die vollständige Erneuerung der technischen Grundlagen umgesetzt werden (2022). Für die Zukunft sind vorgesehen der 'Plan 2.0' (u.a. Alignierung der althochdeutsch-lateinischen Paralleltexte) sowie 'Plan 3.0' (u.a. syntaktische Annotation jenseits der Satzspannen). Wir koordinieren die Weiterentwicklung der Ressource auch mit unseren Partnern im DDD-Verbund.

Zum Entwicklungskonzept gehören auch neue Anwendungsszenarien für die umfänglichen Daten des Referenzkorpus. Mit der Erstellung des 'Lesekorpus Altdeutsch' am Standort Frankfurt am Main wurde zum Beispiel die philologisch orientierte Nutzung der Korpusdaten verbessert und beim Lehrstuhlprojekt der 'Chronografischen Karten' in Berlin stehen Visualisierungs- und Unterrichtskonzepte für sprachhistorische Variationsdaten im Vordergrund.

15.10.2022: Release: Die Version 1.2 des Referenzkorpus Altdeutsch ist verfügbar und online.

22.06.2018: Release: Die Version 1.1 des Referenzkorpus Altdeutsch ist verfügbar und online.

20.03.2018: Vorankündigung: Die Version 1.1 des Referenzkorpus Altdeutsch wird in Bälde erscheinen.

01.01.2017: Release: Die Version 1.0 des Referenzkorpus Altdeutsch ist verfügbar und online.

01.05.2013: Viele Korpora sind mittlerweile mit ANNIS durchsuchbar.

16.10.2012: Neue Versionen vom Tatian und den kleineren althochdeutschen Textdenkmälern wurden online gestellt.

25.7.2012: Der Tatian ist nun auch in der lateinischen Original-Fassung durchsuchbar.

25.6.2012: Der Althochdeutsche Tatian ist in ANNIS verfügbar.

22.6.2012: Die Metadaten der bearbeiteten Texte sind in der Dokumentation abrufbar.

18.4.2012: 43 Texte der kleineren althochdeutschen Textdenkmäler können in ANNIS durchsucht werden.

Ein Publikationsverzeichnis finden Sie hier.

Über uns

Die Webseite deutschdiachrondigital.de wird betrieben vom Institut für deutsche Sprache und Linguistik der Humboldt-Universität zu Berlin.

Kontakt

Humboldt-Universität zu Berlin
Insitut für deutsche Sprache und Linguistik
Unter den Linden 6
10099 Berlin
https://www.linguistik.hu-berlin.de/de

Zur Kontaktseite