普通视图

Received before yesterday

Text+ Workshop „Sprach- und Textdaten für Gesellschaft, Gesundheit und Medizin“ am 05.-06.03.2026 in Hamburg

2025年12月19日 16:09

Das NFDI-Konsortium Text+ lädt ein zum Workshop „Sprach- und Textdaten für Gesellschaft, Gesundheit und Medizin“ am 05.-06.03.2026 am Hamburger Zentrum für Sprachkorpora (HZSK). Der zweitägige Workshop (Lunch-to-Lunch) der TaskArea „Collections“ widmet sich den Schnittstellen zwischen sprach- und textbasierten Forschungsdaten und angrenzenden Disziplinen in den Bereichen Gesellschaft, Gesundheit und Medizin. Gemeinsam wollen wir erkunden, wie sich Forschungsdatenmanagement (FDM) für text- und sprachbasierte Forschung in diesen interdisziplinären Kontexten gestalten lässt.

Text+ ist ein Konsortium der Nationalen Forschungsdateninfrastruktur (NFDI) und hat zum Ziel, sprach- und textbasierte Forschungsdaten langfristig zu erhalten und ihre Nutzung in der Wissenschaft zu ermöglichen. Der Workshop bietet ein Forum für den Austausch über nachhaltige und sichere Bereitstellung, Analyse und Nachnutzung von Forschungsdaten. Dabei geht es u.a. um Fragen der mehrsprachigen Kommunikation und Multimodalität.

Programm-Highlights:

  • Keynotes und Fachvorträge zu aktuellen Herausforderungen und Lösungen im FDM für sprach- und textbasierte Forschungsdaten mit dem Fokus auf die Bereiche Gesellschaft, Gesundheit und Medizin
  • Posterpräsentationen und Demos: Teilnehmende sind eingeladen, eigene Ansätze und Projekte vorzustellen
  • Möglichkeiten der Erschließung weiterer Sprach- und Textdaten sowie deren Integration in Text+ und NFDI4Health

Zielgruppe:

Forscherinnen und Forscher aus den Geistes-, Sozial- und Lebenswissenschaften sowie alle, die sich für sprach- und textbasierte Daten in interdisziplinären Kontexten interessieren.

Anmeldung:

Die Anmeldung erfolgt via: https://events.gwdg.de/event/1252/registrations/1005/. Die Teilnahmegebühr beträgt 40 €. Nach der Anmeldung über die Eventwebsite erhalten Sie alle Informationen zur Überweisung.

Wir freuen uns auf Ihre Teilnahme!

Virtuelles DH-Kolloquium an der BBAW, 14.07.2025: Text+ Musik: Multimodale Kodierungsherausforderungen im DigiMusTh-Kooperationsprojekt

2025年7月9日 15:04

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 14. Juli 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Fabian Moss (Julius-Maximilians-Universität Würzburg)
über
Text+ Musik: Multimodale Kodierungsherausforderungen im DigiMusTh-Kooperationsprojekt

***

Das Text+-Kooperationsproject »DigiMusTh« hat den Aufbau einer offenen digitalen Sammlung historischer musiktheoretischer Texte aus dem deutschsprachigen Raum anhand von Beispielen aus dem 19. Jahrhundert zum Ziel. Diesem Unterfangen stehen eine Reihe besonderer Herausforderungen gegenüber, die sich vornehmlich aus der Multimodalität der Dokumente ergeben, welche neben Text auch Bilder, Grafiken, sowie Musiknotation enthalten. Der Beitrag präsentiert den aktuellen Stand des Projekts, erläutert einige dieser Herausforderungen und stellt Lösungsvorschläge zur Debatte.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 26.05.2025: Oral-History.Digital – Der Aufbau eines Interviewportals und die Erschließung heterogener Archive mit Topic Modeling

2025年5月20日 17:12

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 26. Mai 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Philipp Bayerschmidt und Cord Pagenstecher
über
Oral-History.Digital – Der Aufbau eines Interviewportals und die Erschließung heterogener Archive mit Topic Modeling

***

Das Interviewportal „Oral-History.Digital“ ist eine von der Freien Universität Berlin betriebene Erschließungs- und Recherche-Plattform für wissenschaftliche Sammlungen von audiovisuellen Forschungsdaten (www.oral-history.digital). Universitäten, Museen und Stiftungen können ihre Audio- und Video-Interviews hochladen, mit Werkzeugen für Transkription oder Verschlagwortung bearbeiten und mit einem granularen Rechtemanagement für Bildung und Wissenschaft bereitstellen. Interessierte können die inzwischen über 4000 Interviews von rund 40 Institutionen sammlungsübergreifend durchsuchen. Angemeldete Nutzende können die Aufnahmen mit Untertiteln ansehen, annotieren und zitieren.

Zur Unterstützung der teilnehmenden Interviewarchive hat die an „Oral-History.Digital“ mitwirkende FernUniversität Hagen einen Topic-Modeling-Service entwickelt, der die automatische Erstellung von Inhaltsverzeichnissen und Themenregistern unterstützt. Grundlage ist ein auf Basis von 991 Interviews aus sieben verschiedenen Archiven berechnetes und evaluiertes Topic-Modell. Über ein Register von 100 Topics können nun gezielt Textpassagen zu entsprechend gelabelten Themen gefunden werden. Der Orientierung innerhalb der mehrstündigen Interviews dienen klickbare Inhaltsverzeichnisse, die aus den Topics erzeugt wurden. Zudem unterstützt ein interaktives Dashboard die Analyse der Interviews.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

 
 

Virtuelles DH-Kolloquium an der BBAW, 05.05.2025: Erweiterbare NLP-Pipelines: Komplexe Textanalyse mit MONAPipe

2025年4月11日 21:12

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 5. Mai 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Florian Barth und Tillmann Dönicke
über
Erweiterbare NLP-Pipelines: Komplexe Textanalyse mit MONAPipe

***

In den digitalen Geisteswissenschaften und der Computerlinguistik gibt es eine stetige Nachfrage nach zugänglichen Werkzeugen für die Verarbeitung natürlicher Sprache (NLP), ebenso wie ein kontinuierliches Wachstum der verfügbaren Textdatenmengen. Das spaCy-basierte Python-Paket MONAPipe passt sich an diese Gegebenheiten an, indem es ein modulares, quelloffenes und institutionsübergreifend entwickeltes Pipeline-System bereitstellt, mit dem ein breites Spektrum an Informationen, darunter syntaktische Dependenzen, Koreferenzen, Ereignisse, reflexive Textpassagen und vieles mehr, in Texten ausgezeichnet werden kann.

MONAPipe wird im Rahmen der Nationalen Forschungsdateninfrastruktur Text+ gemeinschaftlich von den beteiligten Partnern für die Anwendung im Bereich der digitalen Geisteswissenschaften entwickelt. Zur Infrastruktur von MONAPipe gehört die Langzeitarchivierung von integrierten Classifiern sowie die Bereitstellung spezifischer Komponenten via API. Letztere können lokal genutzt werden oder als Online-Dienst mit Zugang zu einem Hochleistungsrechenzentrum.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

 
 

Gedenken an Renate Wahrig-Burfeind – Übertragung des Wahrig-Wörterbuchs ins DWDS

2025年3月20日 19:49

Festakt am 25. April 2025 um 17:30 Uhr.

Akademiegebäude am Gendarmenmarkt, Einstein-Saal, Jägerstraße 22/23, 10117 Berlin.

Am 6. Februar 2022 ist Renate Wahrig-Burfeind nach schwerer Krankheit verstorben. Sie hatte seit 2016 am „Digitalen Wörterbuch der deutschen Sprache“ (DWDS) mitgewirkt und es in unermüdlicher Arbeit um über 3.000 Einträge erweitert. Ihre lebenslange berufliche Tätigkeit stand im Zeichen der Transformation des klassischen Wörterbuchs hin zum modernen plattformübergreifenden Medium.

***

Nach dem Tod ihres Vaters Gerhard Wahrig (1923–1978) hatte sie die Weiterentwicklung seines lexikographischen Werks und dessen Überführung in die Welt des Digitalen äußerst engagiert weiterbetrieben. Die Substanz des „WAHRIG Deutsches Wörterbuch“ wird im DWDS in zweifacher Hinsicht eine neue Heimat finden: Ausgewählte Einträge werden eine weitere Grundlage für Aktualisierungen im DWDS-Wörterbuch bilden. Das Wahrig-Wörterbuch wird darüber hinaus als historischer Meilenstein der Lexikographie des 20. Jahrhunderts im DWDS abfragbar sein.

Am Abend des 25. April 2025 erwartet Sie: ein Rückblick auf die Geschichte der Wahrig-Wörterbücher, eine Würdigung des Lebens und Wirkens von Renate Wahrig-Burfeind, ein Beitrag zur Zukunft des Wahrig-Wörterbuchs auf der Webplattform des DWDS sowie ein Festvortrag zur Rolle der Lexikographie in der Gesellschaft. Zudem wird feine Musik zu hören sein. Im Anschluss an das Programm haben Sie bei Getränken und Snacks Gelegenheit zum Austausch.

Mit Jochen Bär (Vorsitzender der Gesellschaft für deutsche Sprache), Sophie Burfeind (brand eins), Alexander Geyken (BBAW), Undine Kramer (BBAW), Bernhard Roll (BBAW)

Moderation: Lothar Lemnitzer (BBAW)
Musik: Youjung Lee (Oboe), Insa Bernds (Klavier)

Für die Anmeldung zur Veranstaltung nutzen Sie bitte das Anmeldeformular unter www.dwds.de/festakt-wahrig.

Virtuelles DH-Kolloquium an der BBAW, 24.02.2025: Hannes Bajohr über „Distanzierte Autorschaft“

2025年2月12日 16:56

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 24. Februar 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Hannes Bajohr (University of California, Berkeley)
über
Distanzierte Autorschaft

***

Der Vortrag gibt einen Überblick über den Begriff der Autorschaft in KI und in Systemen zur Verarbeitung natürlicher Sprache und erörtert frühere und aktuelle Debatten über Computer als literarische Autoren. Er schlägt das Konzept der kausalen Autorenschaft vor, um die Arten der Distanz zwischen menschlichen und maschinellen Agenten zu messen, wobei er die anthropozentrische Ausrichtung dieser Idee anerkennt. Als Gegengewicht dazu wird der Begriff der verteilten Autorschaft diskutiert, der das Netzwerk der an der Entstehung eines Textes beteiligten Akteure berücksichtigt und seine eigenen Grenzen hat. Beide Konzepte sind Elemente einer zukünftigen Theorie der Autorschaft im Zeitalter des maschinellen Lernens.

***

Virtuelles DH-Kolloquium an der BBAW, 27.01.2025: „Wissen im Netzwerk. Praxisrelevante Ansätze zur Überführung von Forschungsdaten digitaler Editionen in Knowledge-Graphen“

2025年1月15日 20:51

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich ein zum ersten Termin im neuen Jahr am Montag, den 27. Januar 2025, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Simone Franz
über
Wissen im Netzwerk. Praxisrelevante Ansätze zur Überführung von Forschungsdaten digitaler Editionen in Knowledge-Graphen

***

Der Vortrag beleuchtet das Zusammenspiel digitaler Editionen, Knowledge-Graphen und bibliothekarischer Wissensorganisation. Dabei nehmen Terminologien wie kontrollierte Vokabulare, Normdaten und Ontologien als vermittelnde Elemente für die disziplinübergreifende semantische Vernetzung von Forschungsdaten und die Wissenskodierung eine zentrale Rolle ein.

Ausgehend von einer Kombination semi-strukturierter Leitfadeninterviews sowie einer Datenmodellierung stellt der Vortrag ausgewählte empirische Befunde zur Analyse des Potentials von Knowledge-Graphen für digitale Editionen vor. Vor dem Hintergrund des Aufbaus von Knowledge-Graphen in den geistes- und kulturwissenschaftlichen Konsortien der Nationalen Forschungsdateninfrastruktur (NFDI) geht er der Frage nach, wie Forschungsdaten digitaler Editionen (bspw. XML/TEI-Registerdateien) semantisch angereichert, geöffnet und nachnutzbar gemacht werden können, um sie in Knowledge-Graphen zu überführen. Dabei werden unter anderem Gender Biases in Wissensbasen, Datenqualität und -herkunft sowie die Bedeutung wissenschaftlicher Bibliotheken und Informationsinfrastrukturen diskutiert.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 02.12.2024: „Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung“

2024年11月26日 16:00

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 2. Dezember 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Oliver Corff
über
Transformative Prozesse in der Lexikologie und Lexikografie des Mandschurischen: Von historischen Wörterbüchern zur digitalen Erschließung

***

Das Volk der Manjuren eroberte im Jahre 1644 die chinesische Hauptstadt Peking, was das offizielle Gründungsdatum der Qing-Dynastie, der letzten großen Fremdherrschaft auf chinesischem Boden, ist. Die Manjuren kultivierten und formalisierten zumindest in der ersten Hälfte der Qing-Dynastie ihre Sprache. Zu diesem Zweck kompilierten sie eine Reihe großer Wörterbücher. Das erste Wörterbuch stammt aus dem Jahr 1708. Der Wortschatz wurde über mehrere Jahrzehnte systematisch erweitert, die Struktur des Wörterbuches bei Beibehaltung der ursprünglichen Organisationsprinzipien selbst reformiert. Das Ergebnis wurde 1772 veröffentlicht.

Gegenstand der Forschungsarbeiten ist die Erarbeitung eines vereinheitlichen Korpus, der beide Wörterbücher umfasst, die Darstellung der Änderungshistorie mit Hilfe stochastischer und anderer Methoden, und die Erarbeitung einer formalen Grammatik, die einerseits der Strukturbeschreibung dient und andererseits den Rahmen für eine maschinell unterstützte Übersetzung des Materials in eine westliche Sprache bereitstellt.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Workshop: Digitale Wörterwelten – Einblick in die Text+ Infrastruktur

2024年10月28日 22:24

Das Konsortium Text+ der Nationalen Forschungsdateninfrastruktur (NFDI) lädt Forschende im Bereich Text- und Sprachdaten zu einem Workshop am 18. und 19. November 2024 in Berlin ein. Die Veranstaltung des Arbeitsbereichs »Lexikalische Ressourcen« bietet die Möglichkeit, die Infrastruktur von Text+ praxisnah kennenzulernen und auf eigene Daten anzuwenden. Themen sind die Bereitstellung von Ressourcen gemäß den FAIR-Prinzipien, Abfragemöglichkeiten und Werkzeuge zur Nutzung lexikalischer Daten sowie die Integration eigener Ressourcen in die Forschungsinfrastruktur. Forschende können eigene Daten mitbringen und aktiv in Diskussionen einbringen, um zukünftige Entwicklungen gemeinsam zu gestalten. Eine Anmeldung ist bis zum 15. November 2024 unter https://events.gwdg.de/event/957/ möglich.

Virtuelles DH-Kolloquium an der BBAW, 28.10.2024: „fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH“

2024年10月22日 19:33

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 28. Oktober 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Timm Lehmberg (Akademie der Wissenschaften in Hamburg)
über
fRAGen Sie Ihre Daten – Perspektiven für den Einsatz von Retrieval Augmented Generation in den DH

***

Der Beitrag führt in die Methoden der Retrieval Augmented Generation (RAG) ein, einem mittlerweile auch in den Digital Humanities verbreiteten Verfahren, das es ermöglicht, auf eigene Datenquellen mithilfe großer Sprachmodelle (Large Language Models, LLMs)  zuzugreifen. Ziel der Mehrzahl der Anwendungsfälle ist dabei zumeist, fachspezifische Abfragen und Analysen (nicht selten unter Verwendung eingeschränkt zugänglicher lokaler Datenbestände) per Chat Prompting durchzuführen.  

Da bereits eine beachtliche Zahl bedienungsfreundlicher Frameworks und gut dokumentierte Workflows den Einstieg out-of-the-box erleichtern, ist das bloße Generieren solcher Abfragen keine sehr große Herausforderung mehr. Die Skalierung und Anpassung und letztendliche Nutzung im Rahmen des wissenschaftlichen Arbeitens hingegen erfordert häufig ein umfassendes Anpassen der einzelnen Schritte und Komponenten. 

Anhand einiger Anwendungsbeispiele wird daher das Verfahren zunächst zu Methoden wie dem Fine-Tuning von LLMs und dem Prompt Engineering abgegrenzt werden. Darauf aufbauend werden die einzelnen Verarbeitungsschritte (Vorverarbeitung der Daten, Chunking, Skalierung des verwendeten Chat Modells etc.) und deren Auswirkungen auf das Retrievalergebnis anschaulich vorgestellt.  

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 30.09.2024: „Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz“

2024年9月23日 18:40

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 30. September 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christian Reul (Universität Würzburg)
über
Automatische Texterkennung für die (digitalen) Geisteswissenschaften – OCR4all als Open-Source-Ansatz

***

Ein zentraler Aspekt der Arbeit von geistes- und kulturwissenschaftlich Forschenden ist die Auseinandersetzung mit historischen Quellen in Form von gedruckten und handschriftlichen Textzeugen. Diese liegen häufig lediglich als Scans vor, aus denen zunächst maschinenverarbeitbarer Volltext extrahiert werden muss, wozu Methoden der automatischen Texterkennung zum Einsatz kommen. Dabei stellen gerade sehr alte Drucke und Handschriften aus verschiedensten Gründen häufig noch eine große Herausforderung dar. Das am Zentrum für Philologie und Digitalität (ZPD) der Universität Würzburg entwickelte, frei verfügbare Open-Source-Tool OCR4all hat zum Ziel, auch technisch weniger versierten Nutzenden die Möglichkeit zu geben, anspruchsvolle Drucke und Handschriften selbstständig und in höchster Qualität zu erschließen. OCR4all fasst den gesamten Texterkennungsworkflow und alle dafür benötigten Tools in einer einzigen Anwendung zusammen, die über eine komfortable grafische Nutzeroberfläche bedient werden kann.

Der Vortrag erläutert zunächst die Grundlagen der automatischen Texterkennung und stellt OCR4all und dessen Funktionsweise vor. Weiterhin wird die Anwendbarkeit und Performanz auf unterschiedlichem Material demonstriert und ein Überblick über aktuelle Arbeiten sowie ein Ausblick auf zukünftige Entwicklungen gegeben.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 27.05.2024: Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

2024年5月7日 21:20

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. Mai 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Konstanze Marx (Universität Greifswald)
über
Herausforderung Instagram: multimodal-ephemere Daten (unter)suchen

***

Als eine der beliebtesten Social-Media-Plattformen rückt Instagram immer mehr in den Fokus von Sprachwissenschaftler:innen. Bislang gibt es jedoch noch keine Standards für Korpora, die multimodale und ephemere Daten enthalten, wie sie für Instagram typisch sind. Gleichzeitig besteht auch bei Studierenden ein großes Interesse an einer wissenschaftlichen Untersuchung der Plattform, weshalb sich die Integration in die akademische Lehre aufdrängt. Datengrundlagen für Untersuchungen im Rahmen von Seminar- und Abschlussarbeiten entstehen häufig nach individueller Absprache. In meinem Vortrag möchte ich an konkreten Daten die Herausforderungen aufzeigen, die mit der Vielgestaltigkeit auf Instagram zusammenhängen und mit der INSTAB-Formel einen Vorschlag unterbreiten, wie Schritt für Schritt eine Datensammlung angelegt werden kann, ohne dass Studierende über Programmierkenntnisse oder besondere technische Voraussetzungen verfügen.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

ZDL-Jahrestagung am 16. Mai 2024

2024年4月17日 21:58

Seit 2019 widmet sich das Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) der Dokumentation des deutschen Wortschatzes in Gegenwart und Geschichte. Die Jahrestagung des ZDL gibt Einblicke sowohl in die fachliche Vielfalt der lexikographischen Arbeit als auch in die  zugrundeliegenden digitalen Methoden. In einem komprimierten Format werden drei ganz  unterschiedliche Schlaglichter auf das ZDL geworfen:

  1. Der Nachmittag widmet sich dem allgegenwärtigen Thema der Generativen KI, insbesondere dem Einfluss, den Large Language Models auf die Lexikographie haben. Dazu wurden erfahrene  internationale Referentinnen und Referenten aus drei zentralen Institutionen Deutschlands und Europas eingeladen.
  2. Im Übergang zur Abendveranstaltung geben insgesamt 8 Posterstände einen Überblick über die bislang  erreichten Ergebnisse des ZDL in der 1. Projektphase.
  3. In der Abendveranstaltung geht es in einem Bühnengespräch und anschließender Lesung um die Praxis des literarischen Übersetzens und die Rolle der Wörterbücher für diese Arbeit.

Auf der Tagungswebsite finden Sie Details zum Programm und zum Ablauf der Veranstaltung. Eine Anmeldung nur für die Nachmittags- bzw. Abendveranstaltung oder aber für beide Veranstaltungen ist möglich.

***

Workshop zur ZDL-Jahrestagung 2024
Generative AI in lexicography / Generative KI in der Lexikographie
Donnerstag, 16. Mai 2024, 14:30 Uhr (Einlass ab 14:00 Uhr)
Akademiegebäude am Gendarmenmarkt
Leibniz-Saal, Markgrafenstraße 38, 10117 Berlin
Anmeldung unter: https://events.gwdg.de/event/758/timetable/

***

Abendveranstaltung zur ZDL-Jahrestagung 2024
WÖRTER FINDEN. Ein Rundgespräch zum literarischen Übersetzen
Donnerstag, 16. Mai 2024, 19:00 Uhr (Einlass ab 18:20 Uhr)
Akademiegebäude am Gendarmenmarkt
Leibniz-Saal, Markgrafenstraße 38, 10117 Berlin
Anmeldung unter: https://events.gwdg.de/event/758/timetable/

***

Bei Rückfragen wenden Sie sich bitte an Franziska Nojack, Öffentlichkeitsarbeit des Zentrums für digitale Lexikographie der deutschen Sprache, nojack@bbaw.de.

Virtuelles DH-Kolloquium an der BBAW, 26.02.2024: Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

2024年2月19日 19:03

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 26. Februar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Lothar Lemnitzer (Berlin-Brandenburgische Akademie der Wissenschaften) und
Thomas Gloning (Justus-Liebig-Universität Gießen und BBAW)
über
Korpora für die Lexikographie. Welche Rolle spielen literarische Texte?

***

In der Tradition der Lexikographie spielte die Literatursprache lange Zeit eine führende Rolle. Der Sprachgebrauch von Schriftstellern und Schriftstellerinnen war Orientierung auch für eigenes Schreiben, die Kenntnis literarischer Werke eines Kanons galt als Ausweis von Bildung. Von daher erwuchs der Lexikographie die Aufgabe, diesen Sprachgebrauch auch zu dokumentieren. Heute ist der Sprachgebrauch von Presse und Medien, unter anderem von Zeitungen, deutlich relevanter im Hinblick auf Themen, die uns umtreiben. Im Hinblick auf Korpora als Grundlage für die Lexikographie kommt noch die leichte Erreichbarkeit digitaler Zeitungstexte hinzu. Deshalb kann man sich fragen: Welche Rollen spielen literarische Texte heute für die Lexikographie und die Nutzer und Nutzerinnen von Digitalen Lexikographischen Systemen?

Ausgehend von den mannigfachen Funktionen, die authentische Textbelege in der gegenwartssprachlichen Lexikographie haben (können), und im Lichte der aktuellen Forschung zur Benutzung gegenwartssprachlicher Wörterbücher wird Lothar Lemnitzer die Praxis der Verwendung von Belegen im Digitalen Wörterbuch der deutschen Sprache (DWDS) darstellen und mit Beispielen illustrieren. Ein Fazit daraus ist, dass literarische Belege in der gegenwärtigen Praxis (des DWDS) eine marginale Rolle spielen.

Thomas Gloning wird demgegenüber die wichtige Rolle literarischer Texte in Korpora für die Lexikographie zu verteidigen suchen und Strategien des Korpusausbaus und der Stratifizierung im Bereich literarischer Texte vorschlagen.

Die beiden Beiträge sollen jeweils ca. 30 Minuten dauern, es soll danach ausführlich Gelegenheit zur Diskussion bestehen.

Dieses Kolloquium ist der 4. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 29.01.2024: Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

2024年1月17日 21:00

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 29. Januar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Noah Bubenhofer (Universität Zürich)
über
Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

***

Seit der Lancierung von ChatGPT befasst sich die breite Öffentlichkeit mit sog. Large Language Models (Sprachmodellen) und streitet über die Chancen und Gefahren dieser Technologie. In meinem Vortrag möchte ich einen linguistischen Blick auf diese Technologie werfen und fragen: Wie verändert sich der Umgang mit Text in der Wissenschaft und welche neuen Möglichkeiten ergeben sich in der Forschung? In der Korpus- und Computerlinguistik ist uns die Arbeit mit Sprachmodellen seit einiger Zeit vertraut, da sie dazu dienen, Sprachgebrauch zu modellieren und zu untersuchen. In ihrer heutigen, interaktiven Form, sind Sprachmodelle jedoch mehr als eine Repräsentation von Sprachgebrauch. Dies soll im Vortrag ebenfalls thematisiert werden.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 11.12.2023: Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

2023年12月4日 19:32

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 11. Dezember 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Roman Schneider (Leibniz-Institut für Deutsche Sprache, Mannheim)
Adrien Barbaresi (Berlin-Brandenburgische Akademie der Wissenschaften)

Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie

***

Roman Schneider (IDS Mannheim): Songtexte als lexikografische Datenbasis

Mit dem Songkorpus (Schneider 2022) liegt erstmalig eine nachhaltig nutzbare wissenschaftliche Ressource für empirische Songtextanalysen vor. Sie enthält zum einen fortlaufend die erfolgreichsten deutschsprachigen Titel der ost-, west- und gesamtdeutschen Hitparaden seit 1970; Chartplatzierungen dienen dabei analog zu Auflagenzahlen bei Zeitungen oder Bestsellerlisten in der Belletristik als Kriterium der Wirkmächtigkeit. Weiterhin dazu gehören thematisch stratifizierte Archive, beispielsweise für Subgenres wie Hiphop oder Neue Deutsche Welle. Und schließlich umfasst das Korpus umfangreich annotierte Künstlerarchive mit den kompletten Werken ausgewählter Sänger und Bands. Insgesamt deckt die kontinuierlich anwachsende Datenbasis mit derzeit ca. 9.000 Songtexten bzw. 2 Millionen Wortformen mehr als ein halbes Jahrhundert populäre Musik(texte) ab und unterstützt damit gleichermaßen synchrone und diachrone Perspektiven.

Ein besonderer Wert der Sammlung liegt in der Dokumentation standardnaher und -ferner Phänomene. Der Vortrag greift ausgewählte lexikalische und morphosyntaktische Eigenheiten auf. Sprachlicher Avantgardismus etwa zeigt sich beim lexikalischen Inventar; mit empirischen Methoden lassen sich dabei Okkasionalismen von echten Neologismen trennen. Weiterhin vorgestellt werden unkonventionelle grammatische Konstruktionen sowie Belege einer sprachökonomisch angepassten Morphosyntax.


Adrien Barbaresi (BBAW): Webkorpora groß und klein

In der modernen Lexikografie stützen sich Aussagen zu sprachlichen Eigenschaften der beschriebenen Wörter und zu Besonderheiten ihrer Verwendung auf umfassende Korpusevidenz. In diesem Rahmen bietet die DWDS-Plattform eine Vielzahl von allgemeinen und spezialisierten Websammlungen. Zwei Korpora verdeutlichen diesen Prozess. Die Basis des Breitband-Webkorpus besteht aus  hunderttausenden Webseiten, aus denen Milliarden von Tokens samt Metadaten erfasst werden. Im Webmonitor werden prominente Quellen aus Deutschland, Österreich, der Schweiz, Südtirol, Luxemburg, Liechtenstein und Ostbelgien fokussiert gesammelt und täglich aktualisiert. Im Vortrag soll gezeigt werden, nach welchen Konzepten die Korpora zusammengestellt werden und wie diese Arbeit mit Werkzeugen unter Open-Source-Lizenz reproduziert werden kann.

Dieses Kolloquium ist der 3. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weiterer Termin der Reihe:

26.02.2024 Korpora, literarischer Wortgebrauch und Lexikographie

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 27.11.2023: Neues aus dem Maschinenraum der Korpus-Annotation

2023年11月20日 18:38

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 27. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Nils Diewald und Marc Kupietz (Leibniz-Institut für Deutsche Sprache, Mannheim)
Gregor Middell und Andreas Nolda (Berlin-Brandenburgische Akademie der Wissenschaften)

Neues aus dem Maschinenraum der Korpus-Annotation

Gegenstand dieses Kolloquiums sind neue Entwicklungen aus dem Maschinenraum der Korpus-Annotation am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim sowie am Zentrum für digitale Lexikographie der deutschen Sprache (ZDL) an der BBAW. Dabei werden zunächst zwei Tools vorgestellt, die an jeweils einer der beiden Institutionen entwickelt werden und an der anderen Institution nachgenutzt werden sollen: der KorAP-Tokenizer von Marc Kupietz und Nils Diewald und das morphologische Analysetool DWDSmor von Andreas Nolda. Darauf aufbauend stellt Gregor Middell eine experimentelle Korpus-Annotationspipeline für die Korpora am ZDL vor, die diese beiden Tools und weitere frei verfügbare Tools kombiniert.

Dieses Kolloquium ist der 2. Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weitere Termine der Reihe:

11.12.2023 Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie
26.02.2024 Korpora, literarischer Wortgebrauch und Lexikographie

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

Virtuelles DH-Kolloquium an der BBAW, 13.11.2023: Historische Textkorpora für die Lexikographie

2023年11月3日 21:24

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 13. November 2023, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Matthias Boenig, Susanne Haaf, Marius Hug
(alle Berlin-Brandenburgische Akademie der Wissenschaften)
Nico Dorn, Volker Harm, Nathalie Mederake, Kerstin Meyer-Hinrichs
(alle Niedersächsische Akademie der Wissenschaften zu Göttingen)

Historische Textkorpora für die Lexikographie

In diesem Kolloquium betrachten wir das Zusammenspiel aus der Bereitstellung historischer Textkorpora des Deutschen als Forschungsdaten und der Nutzung dieser Korpora für die historisch-lexikographische Arbeit.

Im ersten Teil werden wir mögliche Workflows zum Aufbau historischer Korpora beleuchten, wie sie im Kontext des Deutschen Textarchivs (DTA) entwickelt wurden. Im Zentrum stehen dabei Aspekte wie die Ausgewogenheit der Korpora nach Textsorten, Erschließungstiefe, Textqualität, Vollständigkeit der Metadaten, Verfahren der Volltexterfassung (manuell vs. OCR) sowie Perspektiven für zukünftige Textzugewinne und vor diesem Hintergrund das Spannungsfeld aus Qualität und Quantität.

Im zweiten Teil wird die konkrete lexikographische Arbeit mit historischen Korpora am Beispiel des ZDL-Teilprojekts „Wortgeschichte digital“ illustriert. Vorgestellt werden die Nutzung zur Verfügung stehender Korpora sowie Methoden der Belegauswahl, sowohl in inhaltlicher als auch in technischer Hinsicht. Dabei werden auch Anforderungen und Wünsche an historische Korpora aus lexikographischer Perspektive diskutiert.

Das Kolloquium ist Teil der vierteiligen Workshop-Reihe „Korpora für die Lexikographie – Erfahrungen und Zukunftsperspektiven“, die im Herbst und Winter 2023/24 im Rahmen des DH-Kolloquiums stattfindet.

Weitere Termine der Reihe:

27.11.2023 Neues aus dem Maschinenraum der Korpus-Annotation
11.12.2023 Ausweitung der Korpuszone: Neue Daten für die empirische Lexikographie
tba (2024) Korpora, literarischer Wortgebrauch und Lexikographie

 

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzrraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

❌