普通视图

Received before yesterday

Virtuelles DH-Kolloquium an der BBAW, 26.01.2026: „Vertrauen in Daten und Code: Software-Engineering Praktiken zwischen Refactoring, Feature-Wünschen und Publikationsdruck“

2026年1月15日 17:22

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 26. Januar 2026, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Bastian Politycki & Alexander Häberlin (Sammlung Schweizer Rechtsquellen (SSRQ))

Die Entwicklung nachhaltiger Forschungssoftware in den Digital Humanities ist kein rein mechanisches Unterfangen, sondern ein ständiger Aushandlungsprozess zwischen technischen Anforderungen, wissenschaftlicher Arbeit und Pflege der Codebasis. Am Beispiel der „Sammlung Schweizerischer Rechtsquellen“ (SSRQ) beleuchtet dieser Vortrag die Herausforderungen, eine komplexe, historisch gewachsene Editionsinfrastruktur technisch zukunftsfähig zu halten.

Im Zentrum steht die Adaption des professionellen Research Software Engineering (RSE) für den geisteswissenschaftlichen Alltag. Methoden wie Test-Driven Development (TDD) werden nicht nur zur Validierung von Code, sondern auch zur Qualitätssicherung historischer Daten eingesetzt, womit das notwendige „Vertrauen“ in die gedruckte und digitale Edition geschaffen wird. Gleichzeitig erfordert die langfristige Wartbarkeit ein kontinuierliches Refactoring der Codebasis.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 24.11.2025: „TEI-Publisher“

2025年11月17日 20:32

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 24. November 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Wolfgang Meier (Jinntec GmbH)

Der Vortrag stellt die neueste Version von TEI Publisher vor und demonstriert einige der wesentlichen Neuerungen. TEI Publisher 10 führt die Grundidee eines modularen Werkzeugkastens fort und implementiert sie auf einer höheren Ebene: an die Stelle einer zentralen Anwendung, die jeweils auf konkrete Editionsprojekte angepasst wird, tritt nun eine Sammlung von Profilen. Jedes Profil behandelt einen spezifischen Aspekt. Profile implementieren sowohl technische Grundlagen, wie z.B. die Unterstützung für ein bestimmtes XML-Format, Kommunikationsprotokoll oder Teile der Benutzeroberfläche, wie auch funktionale Aspekte, die auf einen bestimmten Editionstyp zugeschnitten sind, z.B. die Navigation zwischen Briefen einer Korrespondenz. Auch Webdesign und Darstellung werden durch Profile festgelegt und sind entsprechend austauschbar.

Eine digitale Editionsanwendung entsteht dann durch die Kombination unterschiedlicher Profile und deren Konfiguration. Letzere erfolgt über eine zentrale Konfigurationsdatei, zu der jedes Profil seine Parameter beiträgt und aus der die Anwendung erzeugt wird. Dies vereinfacht den Entwicklungsprozeß weiter, insbesondere für Anwender ohne Programmiererfahrung. Die Entwicklung kann darüber hinaus nun völlig iterativ erfolgen, d.h. es können jederzeit einzelne Profile hinzugefügt, verändert oder entfernt werden.

Die Aufteilung in Profile verbessert neben der Wiederverwendbarkeit insbesondere auch die Wartbarkeit der Anwendung: Updates können großteils automatisch durchgeführt werden, wenn sich einzelne Profile verändern. Bislang musste dagegen jeweils die gesamte Editionsanwendung manuell angepasst werden, um von einer neueren TEI Publisher-Version zu profitieren. Mit TEI Publisher 10 kümmert sich der zentrale Anwendungsmanager, Jinks, um die Aktualisierung aller Profile und ihrer Abhängigkeiten.

Nutzer können auch eigene Profile erstellen und in die Bibliothek von TEI Publisher integrieren. Dies macht zum einen dann Sinn, wenn bestimmte funktionale oder visuelle Aspekte automatisch auf mehrere Editionsprojekte angewandt werden sollen. So kann z.B. sichergestellt werden, dass alle Publikationen einer Institution eine einheitliche Gestaltung aufweisen und festgelegte Mindeststandards einhalten. Zum anderen können Projekte, die eine bestimmte Funktionalität benötigen, diese als generalisiertes Profil zu TEI Publisher beitragen und mit anderen Projekten teilen. Damit steigt die Wahrscheinlichkeit, dass das entsprechende Profil auch auf längere Sicht verfügbar bleibt und gewartet wird.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 05.05.2025: Erweiterbare NLP-Pipelines: Komplexe Textanalyse mit MONAPipe

2025年4月11日 21:12

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 5. Mai 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Florian Barth und Tillmann Dönicke
über
Erweiterbare NLP-Pipelines: Komplexe Textanalyse mit MONAPipe

***

In den digitalen Geisteswissenschaften und der Computerlinguistik gibt es eine stetige Nachfrage nach zugänglichen Werkzeugen für die Verarbeitung natürlicher Sprache (NLP), ebenso wie ein kontinuierliches Wachstum der verfügbaren Textdatenmengen. Das spaCy-basierte Python-Paket MONAPipe passt sich an diese Gegebenheiten an, indem es ein modulares, quelloffenes und institutionsübergreifend entwickeltes Pipeline-System bereitstellt, mit dem ein breites Spektrum an Informationen, darunter syntaktische Dependenzen, Koreferenzen, Ereignisse, reflexive Textpassagen und vieles mehr, in Texten ausgezeichnet werden kann.

MONAPipe wird im Rahmen der Nationalen Forschungsdateninfrastruktur Text+ gemeinschaftlich von den beteiligten Partnern für die Anwendung im Bereich der digitalen Geisteswissenschaften entwickelt. Zur Infrastruktur von MONAPipe gehört die Langzeitarchivierung von integrierten Classifiern sowie die Bereitstellung spezifischer Komponenten via API. Letztere können lokal genutzt werden oder als Online-Dienst mit Zugang zu einem Hochleistungsrechenzentrum.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

 
 

Virtuelles DH-Kolloquium an der BBAW, 24.02.2025: Hannes Bajohr über „Distanzierte Autorschaft“

2025年2月12日 16:56

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 24. Februar 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Hannes Bajohr (University of California, Berkeley)
über
Distanzierte Autorschaft

***

Der Vortrag gibt einen Überblick über den Begriff der Autorschaft in KI und in Systemen zur Verarbeitung natürlicher Sprache und erörtert frühere und aktuelle Debatten über Computer als literarische Autoren. Er schlägt das Konzept der kausalen Autorenschaft vor, um die Arten der Distanz zwischen menschlichen und maschinellen Agenten zu messen, wobei er die anthropozentrische Ausrichtung dieser Idee anerkennt. Als Gegengewicht dazu wird der Begriff der verteilten Autorschaft diskutiert, der das Netzwerk der an der Entstehung eines Textes beteiligten Akteure berücksichtigt und seine eigenen Grenzen hat. Beide Konzepte sind Elemente einer zukünftigen Theorie der Autorschaft im Zeitalter des maschinellen Lernens.

***

Virtuelles DH-Kolloquium an der BBAW, 27.01.2025: „Wissen im Netzwerk. Praxisrelevante Ansätze zur Überführung von Forschungsdaten digitaler Editionen in Knowledge-Graphen“

2025年1月15日 20:51

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich ein zum ersten Termin im neuen Jahr am Montag, den 27. Januar 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Simone Franz
über
Wissen im Netzwerk. Praxisrelevante Ansätze zur Überführung von Forschungsdaten digitaler Editionen in Knowledge-Graphen

***

Der Vortrag beleuchtet das Zusammenspiel digitaler Editionen, Knowledge-Graphen und bibliothekarischer Wissensorganisation. Dabei nehmen Terminologien wie kontrollierte Vokabulare, Normdaten und Ontologien als vermittelnde Elemente für die disziplinübergreifende semantische Vernetzung von Forschungsdaten und die Wissenskodierung eine zentrale Rolle ein.

Ausgehend von einer Kombination semi-strukturierter Leitfadeninterviews sowie einer Datenmodellierung stellt der Vortrag ausgewählte empirische Befunde zur Analyse des Potentials von Knowledge-Graphen für digitale Editionen vor. Vor dem Hintergrund des Aufbaus von Knowledge-Graphen in den geistes- und kulturwissenschaftlichen Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI) geht er der Frage nach, wie Forschungsdaten digitaler Editionen (bspw. XML/TEI-Registerdateien) semantisch angereichert, geöffnet und nachnutzbar gemacht werden können, um sie in Knowledge-Graphen zu überführen. Dabei werden unter anderem Gender Biases in Wissensbasen, Datenqualität und -herkunft sowie die Bedeutung wissenschaftlicher Bibliotheken und Informationsinfrastrukturen diskutiert.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 02.12.2024: „Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung“

2024年11月26日 16:00

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 2. Dezember 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Oliver Corff
über
Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung

***

Das Volk der Manjuren eroberte im Jahre 1644 die chinesische Hauptstadt Peking, was das offizielle Gründungsdatum der Qing-Dynastie, der letzten großen Fremdherrschaft auf chinesischem Boden, ist. Die Manjuren kultivierten und formalisierten zumindest in der ersten Hälfte der Qing-Dynastie ihre Sprache. Zu diesem Zweck kompilierten sie eine Reihe großer Wörterbücher. Das erste Wörterbuch stammt aus dem Jahr 1708. Der Wortschatz wurde über mehrere Jahrzehnte systematisch erweitert, die Struktur des Wörterbuches bei Beibehaltung der ursprünglichen Organisationsprinzipien selbst reformiert. Das Ergebnis wurde 1772 veröffentlicht.

Gegenstand der Forschungsarbeiten ist die Erarbeitung eines vereinheitlichen Korpus, der beide Wörterbücher umfasst, die Darstellung der Änderungshistorie mit Hilfe stochastischer und anderer Methoden, und die Erarbeitung einer formalen Grammatik, die einerseits der Strukturbeschreibung dient und andererseits den Rahmen für eine maschinell unterstützte Übersetzung des Materials in eine westliche Sprache bereitstellt.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 28.10.2024: „fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH“

2024年10月22日 19:33

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Timm Lehmberg (Akademie der Wissenschaften in Hamburg)
über
fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH

***

Der Beitrag führt in die Methoden der Retrieval Augmented Generation (RAG) ein, einem mittlerweile auch in den Digital Humanities verbreiteten Verfahren, das es ermöglicht, auf eigene Datenquellen mithilfe großer Sprachmodelle (Large Language Models, LLMs)  zuzugreifen. Ziel der Mehrzahl der Anwendungsfälle ist dabei zumeist, fachspezifische Abfragen und Analysen (nicht selten unter Verwendung eingeschränkt zugänglicher lokaler Datenbestände) per Chat Prompting durchzuführen.  

Da bereits eine beachtliche Zahl bedienungsfreundlicher Frameworks und gut dokumentierte Workflows den Einstieg out-of-the-box erleichtern, ist das bloße Generieren solcher Abfragen keine sehr große Herausforderung mehr. Die Skalierung und Anpassung und letztendliche Nutzung im Rahmen des wissenschaftlichen Arbeitens hingegen erfordert häufig ein umfassendes Anpassen der einzelnen Schritte und Komponenten. 

Anhand einiger Anwendungsbeispiele wird daher das Verfahren zunächst zu Methoden wie dem Fine-Tuning von LLMs und dem Prompt Engineering abgegrenzt werden. Darauf aufbauend werden die einzelnen Verarbeitungsschritte (Vorverarbeitung der Daten, Chunking, Skalierung des verwendeten Chat Modells etc.) und deren Auswirkungen auf das Retrievalergebnis anschaulich vorgestellt.  

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

2024年9月23日 18:40

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen. Dabei stellen gerade sehr alte Drucke und Handschriften aus verschiedensten Gründen häufig noch eine große Herausforderung dar. Das am Zentrum für Philologie und Digitalität (ZPD) der Universität Würzburg entwickelte, frei verfügbare Open-Source-Tool OCR4all hat zum Ziel, auch technisch weniger versierten Nutzenden die Möglichkeit zu geben, anspruchsvolle Drucke und Handschriften selbstständig und in höchster Qualität zu erschließen. OCR4all fasst den gesamten Texterkennungsworkflow und alle dafür benötigten Tools in einer einzigen Anwendung zusammen, die über eine komfortable grafische Nutzeroberfläche bedient werden kann.

Der Vortrag erläutert zunächst die Grundlagen der automatischen Texterkennung und stellt OCR4all und dessen Funktionsweise vor. Weiterhin wird die Anwendbarkeit und Performanz auf unterschiedlichem Material demonstriert und ein Überblick über aktuelle Arbeiten sowie ein Ausblick auf zukünftige Entwicklungen gegeben.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 27.05.2024: Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

2024年5月7日 21:20

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. Mai 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Konstanze Marx (Universität Greifswald)
über
Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

***

Als eine der beliebtesten Social-Media-Plattformen rückt Instagram immer mehr in den Fokus von Sprachwissenschaftler:innen. Bislang gibt es jedoch noch keine Standards für Korpora, die multimodale und ephemere Daten enthalten, wie sie für Instagram typisch sind. Gleichzeitig besteht auch bei Studierenden ein großes Interesse an einer wissenschaftlichen Untersuchung der Plattform, weshalb sich die Integration in die akademische Lehre aufdrängt. Datengrundlagen für Untersuchungen im Rahmen von Seminar- und Abschlussarbeiten entstehen häufig nach individueller Absprache. In meinem Vortrag möchte ich an konkreten Daten die Herausforderungen aufzeigen, die mit der Vielgestaltigkeit auf Instagram zusammenhängen und mit der INSTAB-Formel einen Vorschlag unterbreiten, wie Schritt für Schritt eine Datensammlung angelegt werden kann, ohne dass Studierende über Programmierkenntnisse oder besondere technische Voraussetzungen verfügen.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 26.02.2024: Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

2024年2月19日 19:03

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 26. Februar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Lothar Lemnitzer (Berlin-Brandenburgische Akademie der Wissenschaften) und
Thomas Gloning (Justus-Liebig-Universität Gießen und BBAW)
über
Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

***

In der Tradition der Lexikographie spielte die Literatursprache lange Zeit eine führende Rolle. Der Sprachgebrauch von Schriftstellern und Schriftstellerinnen war Orientierung auch für eigenes Schreiben, die Kenntnis literarischer Werke eines Kanons galt als Ausweis von Bildung. Von daher erwuchs der Lexikographie die Aufgabe, diesen Sprachgebrauch auch zu dokumentieren. Heute ist der Sprachgebrauch von Presse und Medien, unter anderem von Zeitungen, deutlich relevanter im Hinblick auf Themen, die uns umtreiben. Im Hinblick auf Korpora als Grundlage für die Lexikographie kommt noch die leichte Erreichbarkeit digitaler Zeitungstexte hinzu. Deshalb kann man sich fragen: Welche Rollen spielen literarische Texte heute für die Lexikographie und die Nutzer und Nutzerinnen von Digitalen Lexikographischen Systemen?

Ausgehend von den mannigfachen Funktionen, die authentische Textbelege in der gegenwartssprachlichen Lexikographie haben (können), und im Lichte der aktuellen Forschung zur Benutzung gegenwartssprachlicher Wörterbücher wird Lothar Lemnitzer die Praxis der Verwendung von Belegen im Digitalen Wörterbuch der deutschen Sprache (DWDS) darstellen und mit Beispielen illustrieren. Ein Fazit daraus ist, dass literarische Belege in der gegenwärtigen Praxis (des DWDS) eine marginale Rolle spielen.

Thomas Gloning wird demgegenüber die wichtige Rolle literarischer Texte in Korpora für die Lexikographie zu verteidigen suchen und Strategien des Korpusausbaus und der Stratifizierung im Bereich literarischer Texte vorschlagen.

Die beiden Beiträge sollen jeweils ca. 30 Minuten dauern, es soll danach ausführlich Gelegenheit zur Diskussion bestehen.

Dieses Kolloquium ist der 4. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 29.01.2024: Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

2024年1月17日 21:00

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 29. Januar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Noah Bubenhofer (Universität Zürich)
über
Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

***

Seit der Lancierung von ChatGPT befasst sich die breite Öffentlichkeit mit sog. Large Language Models (Sprachmodellen) und streitet über die Chancen und Gefahren dieser Technologie. In meinem Vortrag möchte ich einen linguistischen Blick auf diese Technologie werfen und fragen: Wie verändert sich der Umgang mit Text in der Wissenschaft und welche neuen Möglichkeiten ergeben sich in der Forschung? In der Korpus- und Computerlinguistik ist uns die Arbeit mit Sprachmodellen seit einiger Zeit vertraut, da sie dazu dienen, Sprachgebrauch zu modellieren und zu untersuchen. In ihrer heutigen, interaktiven Form, sind Sprachmodelle jedoch mehr als eine Repräsentation von Sprachgebrauch. Dies soll im Vortrag ebenfalls thematisiert werden.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 11.12.2023: Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

2023年12月4日 19:32

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 11. Dezember 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Roman Schneider (Leibniz-Institut für Deutsche Sprache, Mannheim)
Adrien Barbaresi (Berlin-Brandenburgische Akademie der Wissenschaften)

Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

***

Roman Schneider (IDS Mannheim): Songtexte als lexikografische Datenbasis

Mit dem Songkorpus (Schneider 2022) liegt erstmalig eine nachhaltig nutzbare wissenschaftliche Ressource für empirische Songtextanalysen vor. Sie enthält zum einen fortlaufend die erfolgreichsten deutschsprachigen Titel der ost-, west- und gesamtdeutschen Hitparaden seit 1970; Chartplatzierungen dienen dabei analog zu Auflagenzahlen bei Zeitungen oder Bestsellerlisten in der Belletristik als Kriterium der Wirkmächtigkeit. Weiterhin dazu gehören thematisch stratifizierte Archive, beispielsweise für Subgenres wie Hiphop oder Neue Deutsche Welle. Und schließlich umfasst das Korpus umfangreich annotierte Künstlerarchive mit den kompletten Werken ausgewählter Sänger und Bands. Insgesamt deckt die kontinuierlich anwachsende Datenbasis mit derzeit ca. 9.000 Songtexten bzw. 2 Millionen Wortformen mehr als ein halbes Jahrhundert populäre Musik(texte) ab und unterstützt damit gleichermaßen synchrone und diachrone Perspektiven.

Ein besonderer Wert der Sammlung liegt in der Dokumentation standardnaher und -ferner Phänomene. Der Vortrag greift ausgewählte lexikalische und morphosyntaktische Eigenheiten auf. Sprachlicher Avantgardismus etwa zeigt sich beim lexikalischen Inventar; mit empirischen Methoden lassen sich dabei Okkasionalismen von echten Neologismen trennen. Weiterhin vorgestellt werden unkonventionelle grammatische Konstruktionen sowie Belege einer sprachökonomisch angepassten Morphosyntax.


Adrien Barbaresi (BBAW): Webkorpora groß und klein

In der modernen Lexikografie stützen sich Aussagen zu sprachlichen Eigenschaften der beschriebenen Wörter und zu Besonderheiten ihrer Verwendung auf umfassende Korpusevidenz. In diesem Rahmen bietet die DWDS-Plattform eine Vielzahl von allgemeinen und spezialisierten Websammlungen. Zwei Korpora verdeutlichen diesen Prozess. Die Basis des Breitband-Webkorpus besteht aus  hunderttausenden Webseiten, aus denen Milliarden von Tokens samt Metadaten erfasst werden. Im Webmonitor werden prominente Quellen aus Deutschland, Österreich, der Schweiz, Südtirol, Luxemburg, Liechtenstein und Ostbelgien fokussiert gesammelt und täglich aktualisiert. Im Vortrag soll gezeigt werden, nach welchen Konzepten die Korpora zusammengestellt werden und wie diese Arbeit mit Werkzeugen unter Open-Source-Lizenz reproduziert werden kann.

Dieses Kolloquium ist der 3. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weiterer Termin der Reihe:

26.02.2024 Korpora, literarischer Wortgebrauch und Lexikographie

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 27.11.2023: Neues aus dem Maschinenraum der Korpus-Annotation

2023年11月20日 18:38

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Nils Diewald und Marc Kupietz (Leibniz-Institut für Deutsche Sprache, Mannheim)
Gregor Middell und Andreas Nolda (Berlin-Brandenburgische Akademie der Wissenschaften)

Neues aus dem Maschinenraum der Korpus-Annotation

Gegenstand dieses Kolloquiums sind neue Entwicklungen aus dem Maschinenraum der Korpus-Annotation am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim sowie am Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) an der BBAW. Dabei werden zunächst zwei Tools vorgestellt, die an jeweils einer der beiden Institutionen entwickelt werden und an der anderen Institution nachgenutzt werden sollen: der KorAP-Tokenizer von Marc Kupietz und Nils Diewald und das morphologische Analysetool DWDSmor von Andreas Nolda. Darauf aufbauend stellt Gregor Middell eine experimentelle Korpus-Annotationspipeline für die Korpora am ZDL vor, die diese beiden Tools und weitere frei verfügbare Tools kombiniert.

Dieses Kolloquium ist der 2. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weitere Termine der Reihe:

11.12.2023 Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie
26.02.2024 Korpora, literarischer Wortgebrauch und Lexikographie

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 13.11.2023: Historische Textkorpora für die Lexikographie

2023年11月3日 21:24

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 13. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Matthias Boenig, Susanne Haaf, Marius Hug
(alle Berlin-Brandenburgische Akademie der Wissenschaften)
Nico Dorn, Volker Harm, Nathalie Mederake, Kerstin Meyer-Hinrichs
(alle Niedersächsische Akademie der Wissenschaften zu Göttingen)

Historische Textkorpora für die Lexikographie

In diesem Kolloquium betrachten wir das Zusammenspiel aus der Bereitstellung historischer Textkorpora des Deutschen als Forschungsdaten und der Nutzung dieser Korpora für die historisch-lexikographische Arbeit.

Im ersten Teil werden wir mögliche Workflows zum Aufbau historischer Korpora beleuchten, wie sie im Kontext des Deutschen Textarchivs (DTA) entwickelt wurden. Im Zentrum stehen dabei Aspekte wie die Ausgewogenheit der Korpora nach Textsorten, Erschließungstiefe, Textqualität, Vollständigkeit der Metadaten, Verfahren der Volltexterfassung (manuell vs. OCR) sowie Perspektiven für zukünftige Textzugewinne und vor diesem Hintergrund das Spannungsfeld aus Qualität und Quantität.

Im zweiten Teil wird die konkrete lexikographische Arbeit mit historischen Korpora am Beispiel des ZDL-Teilprojekts „Wortgeschichte digital“ illustriert. Vorgestellt werden die Nutzung zur Verfügung stehender Korpora sowie Methoden der Belegauswahl, sowohl in inhaltlicher als auch in technischer Hinsicht. Dabei werden auch Anforderungen und Wünsche an historische Korpora aus lexikographischer Perspektive diskutiert.

Das Kolloquium ist Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weitere Termine der Reihe:

27.11.2023 Neues aus dem Maschinenraum der Korpus-Annotation
11.12.2023 Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie
tba (2024) Korpora, literarischer Wortgebrauch und Lexikographie

 

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 30.10.2023: „Capture and Preserve Memoirs using AI and Web 3 Technology“

2023年10月17日 20:53

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. Oktober 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Dr. Andreas Vogel (Founding Director Legacy Page Ltd.)

While many have the desire to create a personal or professional legacy in form of memoirs, few follow through with it. According to our research, the obstacles include lack of writing, production and other technical skills for capturing memoirs and the lack of a suitable platform for storing and connecting memoirs.

LEGACY is a project dedicated to capturing, semantically connecting and preserving memoirs forever by means of digital technology and business model and governance innovations. Digital technology, specifically Web 3 technology and Artificial Intelligence (AI) offer new means for capturing and preserving memoirs.

Generative A.I. –

providing an interactive AI solution to interview people and auto-generate high-quality memoirs, just like what a ghostwriter would do, but with infinite customizability and scalability.

Web 3 –

providing access control and secure encryption of memoirs, minting ownership certificates (in the form of NFTs) with appropriate licensing terms, and linking them to an author’s decentralized self-sovereign identity.

Business Model Innovation-

striving to preserve memoirs “forever” based on an easy to understand pay-once-store-forever pricing model, and long-term perpetual, self-renewing decentralized storage contracts.

Machine Learning –

using machine learning to semantically connect memoirs in a weighted graph, creating a unique collaborative history from individual memoirs.

Governance –

LEGACY requires a governance model which allows it to operate for a very long time while  reserving its mission and culture. We have combined the learnings from long lasting foundations, academies and religious organizations with the Web 3 concept of Decentralized Autonomous Organisations (DAO) for creating a digital governance model for LEGACY.

 

❌