Textuelle Forschungsdaten standardisieren – Einführung in die Richtlinien und Werkzeuge der Text Encoding Initiative (TEI)
Typ | Präsenzseminar |
---|---|
Dozent/in | Sandra Balck |
Anmeldung | → Online anmelden |
Raum | Garystr. 39 Schulungsraum K063 |
Beginn | 13.01.2026 | 10:00 |
Ende | 13.01.2026 | 14:00 |
Zielgruppe
Lehrende, Forschende, Mitarbeitende und Studierende der Freien Universität
Voraussetzungen
Inhaltliche Voraussetzungen:
- Grundkenntnisse in der Arbeit mit XML und im Umgang mit dem Oxygen XML Editor sind von Vorteil, aber nicht zwingend erforderlich
Technische Voraussetzungen:
- Eigener Laptop
- Installation des Oxygen XML Editor (Download & Installationsanleitung: https://my.fu-berlin.de/software/swshop-staff.php#oxygen_xml-editor)
Vom Dokument zur Edition (Teil 3): Textuelle Forschungsdaten standardisieren – Einführung in die Richtlinien und Werkzeuge der Text Encoding Initiative (TEI)
Mit dem Medienwandel zeichnet sich auch im Bereich kritischer Editionen ein Paradigmenwechsel ab: Die Tendenz geht zur „digitalen Edition“, die entweder begleitend zur klassischen Print-Publikation eingesetzt wird oder diese als genuin digitales Produkt immer häufiger vollständig substituiert. Das Internet, sog. neue Medien sowie der verstärkte Einsatz von Informationstechnologie in den Geisteswissenschaften eröffnen dabei neue Möglichkeitsräume für Erfassung, Analyse und Visualisierung von Inhalten. Um diese Potenziale ausschöpfen und in nachhaltige Editionsprodukte umsetzen zu können, gilt es bei Konzeption und Realisierung konsequent einem „digitale Paradigma“ zu folgen. Dies erfordert u. a. ein grundlegendes Verständnis der involvierten Technologien und technischen Prozesse von der Erschließung des zu edierenden Gegenstands bis hin zu dessen Präsentation in ggf. multiplen Wiedergabeszenarien.
Die Text Encoding Initiative (TEI) dient in den Digital Humanities als De-facto-Standard für die strukturierte und interoperable Erschließung textueller Daten, um diese an unterschiedliche Anforderungen anzupassen und nachhaltig für die wissenschaftliche Community zugänglich zu machen. In dieser Veranstaltung befassen Sie sich mit der digitalen Textauszeichnung und lernen, wie historische Dokumente gemäß den Richtlinien der TEI standardisiert werden können. Sie erhalten eine Einführung in die grundlegenden Konzepte und das Markup-Vokabular der TEI und erfahren, wie sich diese an spezifische Projektanforderungen angepassen lassen. Neben den theoretischen Aspekten erwerben Sie in verschiedenen Übungen auch praktische Fähigkeiten im Umgang mit den Werkzeugen der TEI.
Die Veranstaltung ist Teil der Reihe „Vom Dokument zur Edition“, die einen Gesamtüberblick über eine mögliche technische Infrastruktur für die digitale Edition handschriftlicher Dokumente vermittelt. Die Veranstaltungen bauen aufeinander auf, können aber auch als Einzelveranstaltung besucht werden.
- Teil 1: Dokumente automatisiert transkribieren – Handschriftenerkennung mit OCR/HTR-Software
- Teil 2: Textdaten modellieren und kodieren – Einführung in XML und die Arbeit mit dem Oxygen XML Editor
- Teil 4: Editionsdaten semantisch anreichern – XML-Parsing und Named Entity Recognition (NER) mit Python
- Teil 5: Digitale Editionen publizieren – TEI-basierte Textpräsentation mit der TYPED-Infrastruktur
Inhalte
- Konzepte von „Markup-Sprachen“
- XML als (Meta-)Markup-Sprache
- XML-Komponenten
- Kriterium der „Wohlgeformtheit“
- Dokumenttyp-Definition, XML-Schemasprachen und Kriterium der „Validität“
- Bearbeitung und Kontrolle von XML-Dokumenten mit dem Oxygen XML Editor
Lernziele
- Sie lernen grundlegende Konzepte von Markup-Sprachen kennen.
- Sie bekommen einen Überblick über den Aufbau und die Bestandteile von XML-Dokumenten.
- Sie üben die Erstellung, Be- und Verarbeitung von XML-Dokumenten mit dem Oxygen XML Editor.
- Sie lernen, bestimmte Perspektiven auf Dokumente und Texte in Modellen auszudrücken und diese für die Arbeit mit XML-Dokumenten zu nutzen.