Textdatenbank und Wörterbuch des Klassischen Maya
Überblick
Die Nordrhein-Westfälische Akademie der Wissenschaften und Künste in Düsseldorf richtet 2014 an der Philosophischen Fakultät der Universität Bonn die Arbeitsstelle "Textdatenbank und Wörterbuch des Klassischen Maya) zur Erforschung von Schrift und Sprache der Mayakultur ein (Pressemitteilung und Kurzfilm). Ziel dieses von Prof. Dr. Nikolai Grube von der Abteilung für Altamerikanistik geleiteten Vorhabens ist die texttechnologische und epigraphische Aufarbeitung sämtlicher Maya-Hieroglyphentexte, auf deren Grundlage in den kommenden fünfzehn Jahren ein umfassendes Wörterbuch der klassischen Mayasprache kompiliert und ediert wird. Das mit 5,4 Millionen Euro geförderte Langzeitvorhaben ist methodisch in den digitalen Geisteswissenschaften verortet und wird in Kooperation mit dem eHumanities Forschungsverbund TextGrid (Niedersächsische Staats- und Universitätsbibliothek Göttingen), mit der Universitäts- und Landesbibliothek Bonn und dem Cologne Center for eHumanities durchgeführt. Mit der Ausrichtung auf die digitalen Geisteswissenschaften bildet das Wörterbuch-Projekt eine wichtige Schnittstelle zwischen Humanities und Informatik an der Universität Bonn.
Mitarbeiter und Kooperationspartner
Unter der Projektleitung von Prof. Dr. Nikolai Grube bilden die Altamerikanisten Dr. Christian Prager (Epigraphik & Projektkoordination), Elisabeth Wagner M.A. (Epigraphik & Ikonologie), Antje Grothe M.A (Metadaten und Bibliographie), Guido Krempel M.A. (Epigraphik) und Tobias Mercer BA (Informatik) den Kern des Bonner Forschungsteams und unterhält Kooperationen mit Institutionen und Wissenschaftlern im In- und Ausland. Aufbau und Pflege der computerbasierten Infrastruktur sowie die Präsentation der digitalen Forschungsdaten basieren auf Kooperationen zwischen dem Projekt und der Universitäts- und Landesbibliothek Bonn (ULB), der Staats- und Universitätsbibliothek Göttingen (SUB) sowie dem Cologne Center for eHumanities.
Zielsetzung und Projektarchitektur
Im Fokus des Langzeitvorhabens steht die Hieroglyphenschrift und Sprache der vorspanischen Mayakultur, die in der Zeit zwischen dem 3. Jahrhundert v. Chr. und 1500 n. Chr. auf dem Gebiet der heutigen Staaten Mexiko, Guatemala, Belize und Honduras verwendet wurde und auf Tausenden von Inschriftenträgern erhalten ist. Ziele des Projekts sind die Erschließung dieses Ausgangsmaterials in einem digitalen Textkorpus und die Kompilation eines Wörterbuchs des Klassischen Maya, das als Datenbank und in gedruckter Form den gesamten Sprachschatz und dessen Verwendung in der Schrift abbildet. Gemeinsam mit Sprachwissenschaftlern und Informatikern werden die Projektmitarbeiter über die virtuelle Forschungsumgebung TextGrid in Bonn und Göttingen die Hieroglyphentexte mit geisteswissenschaftlichen Methoden und informationstechnischen Werkzeugen aufbereiten, auswerten und interpretieren. Mit der Kompilation des digitalen Textkorpus und Wörterbuchs werden zum ersten Mal die Grundlagen für ein systematisches Verständnis der Struktur des Schriftsystems und des Klassischen Maya, der dem Schriftsystem zugrunde liegenden Hochsprache, gelegt. Grundlage des Projektes bildet das maschinenlesbare Textkorpus, das die Texte zur computergestützten Recherche bereitstellt und komplexe Recherchen erlaubt. Auf diese Weise wird eine dynamisch organisierte lexikalische Datenbank eingerichtet. Das digitale Textkorpus wird so angelegt, dass es jederzeit erweiter- und aktualisierbar ist. Neue Entwicklungen in der Schriftforschung können auf diese Weise verfolgt, Revisionen ergänzt und aktuelle Interpretationen und Beschreibungen integriert werden. Die korpusbasierte Arbeitsweise ermöglicht es, alle Schrift- und Sprachdaten einschließlich unentzifferter Textstellen zu berücksichtigen, Zitate der jeweiligen Textstellen in originaler hieroglyphischer Schreibung abzubilden, zeitliche und räumliche Angaben einzubinden, epigraphische und sprachwissenschaftliche Analysen durchzuführen, kulturhistorische Kommentierungen sowie Verweise auf Sekundärliteratur zu integrieren. Durch die datenbanktechnische Erfassung der Texte können Konkordanz- und Kollokationsanalysen durchgeführt oder Textmuster erkannt werden. Erstmals wird ein vollständiges Inventar der Schrift und der durch sie repräsentierten Sprache erstellt, wodurch die Entwicklung von Schrift und Sprache in historischer Perspektive verfolgt werden kann. IDIOM will als Grundlagenprojekt nicht nur den kulturellen Wortschatz und die Summe der Forschungen zur Mayaschrift und -sprache abbilden, sondern gleichzeitig mit dem Datenmaterial einen fundamentalen Beitrag für die vergleichende Schriftforschung leisten. Das Vorhaben erfasst auf der Grundlage korpusbasierter Lexikographie alle Textträger der Klassischen Mayakultur in originaler Schreibung und Transkription in einer Datenbank, die in der virtuellen Forschungsumgebung TextGrid angelegt ist und dadurch ständig ergänzt und modifiziert werden kann. Das Inschriftenarchiv von IDIOM wird Open Access in den Digitalen Sammlungen der Universitäts- und Landesbibliothek Bonn (ULB) präsentiert und ist aufgrund dieser Infrastruktur langfristig gesichert. Die in Göttingen gehostete, für Spezialisten zugängliche Textdatenbank bildet schließlich die Basis für die epigraphischen und linguistischen Analysen, auf deren Grundlage das Wörterbuch kompiliert und zur Publikation im Internet sowie als Druckversion vorbereitet wird. Textdatenbank und Wörterbuch werden bereits im Laufe des Projekts über das Internet zur freien Recherche zur Verfügung stehen.
Präsentation und Archivierung der Forschungsdaten
Das virtuelle Inschriftenarchiv mit Abbildungen, Transkriptionen und Übersetzungen wird langfristig in den Digitalen Sammlungen der ULB integriert und steht für die Öffentlichkeit zur freien Recherche zur Verfügung (siehe Abbildung unten). Für die Erstellung, Verwaltung und Speicherung der textuellen und graphischen Korpusdaten wird die Virtuelle Forschungsumgebung TextGrid (SUB) eingesetzt, die ein vernetztes, kollaboratives Arbeiten ermöglicht und eine Arbeitsplattform für sprachwissenschaftliche und korpuslinguistische Informationstechnologien bietet.
Die lexikalische Datenbank wird als Bestandteil der Virtuellen Forschungsumgebung TextGrid eingebunden und archiviert, so dass die Forschungsdaten über den Ablauf des Projekts hinaus langfristig aufbewahrt werden. Das gedruckte Wörterbuch wird gegen Ende der Projektlaufzeit ediert und veröffentlicht. Zuvor werden regelmäßig um neue oder aktualisierte Daten ergänze Vorversionen publiziert, so dass alle Forschungsdaten im Laufe des Projekts vollumfänglich Open Access für die Öffentlichkeit zugänglich sind.
Datenbanken und Tools
Bilddatenbank "Maya Image Archive"
Kontakt
cprager (at) uni-bonn.de