普通视图

Received before yesterday

Wissenswasserfälle in Bielefeld

2025年9月3日 04:05

Mein persönlicher Bericht von der DHd 2025


Kurzvorstellung

Hallo liebe Forschende,

mein Name ist Jan Eberhardt und als Studierender des Masters Digitale Methodik in den Geistes- und Kulturwissenschaften in Mainz hatte ich die Ehre, an der jährlichen Konferenz der Digital Humanities im deutschsprachigen Raum (DHd) 2025 in Bielefeld teilzunehmen. Die Reise- und Unterkunftskosten wurden durch ein Stipendium von NFDI4memory gefördert.

Meinen Bachelor absolvierte ich ebenfalls in Mainz, im Studiengang Buchwissenschaft, weshalb ich mich dazu entschieden habe, nach diesem Post auf dem DHd-Blog im Idealfall auf meinem eigenen Blog vor allem über Neuigkeiten zur Forschung aus diesen Fachbereichen zu berichten.

Ende des Jahres möchte ich mit meiner Masterarbeit beginnen und es macht für mich absolut Sinn, das gelernte aus beiden Studiengängen miteinander zu verknüpfen und mit der Welt zu teilen, anstatt nur vor meinen eigenen Stichpunkten zu sitzen.

Bericht von der DHd 2025

Mein Vorhaben auf der diesjährigen DHd bestand darin, alle Informationen mitzunehmen, die meine Fachbereiche und mein Forschungsinteresse miteinander verbinden, oder die ich in der späteren Forschung nutzen kann. Das war ein sehr ambitioniertes Ziel, wie ich in dieser Woche feststellen musste. Um die Länge dieses Blogposts auch nicht zu lang werden zu lassen, werde ich versuchen, mich vor allem auf meine persönlichen Erkenntnisse beschränken. Aber der Reihe nach:

Das Thema, das die gesamte Konferenz mit dem Untertitel „under construction“ überlagerte, waren Large Language Models (LLMs), da sie in den vergangenen Jahren in vielen Bereichen der Forschung getestet und diese Ergebnisse nun vorgestellt wurden.

Montags begann die Konferenzwoche direkt mit dem Workshop „eScriptorium meets LLMs: Moderne KI-Systeme im Kontext der Volltexterschließung“ von Forschenden der Universitätsbibliothek Mannheim, mit einem interessanten Beispiel zur Post-Correction von OCR-Ergebnissen und der Nutzung von LLMs für Named Entity Recognition (NER), also der automatischen Erkennung und Deklarierung von z.B. Namen oder Orte als solche.

Das Thema Texterschließung von Handschriften und Drucken aus dem Mittelalter und der Frühen Neuzeit ist für mich von besonderem Interesse, da ich mich für die Masterarbeit mit einem Text aus dieser Zeit befassen werde. Des Weiteren habe ich sehr großes Interesse an der nachnutzbaren Digitalisierung und dem weiterem Einsatz Digitaler Methoden, wie der von mir schon im Studium verwendeten NER, an Dokumenten aus meiner Heimatregion Rheinhessen, die bekanntermaßen eine sehr bedeutende Geschichte aufweist. 

Dienstags gab es einen ganztägigen Workshop mit einem sehr theoretischen Teil zur Definition von Ground Truth und Hermeneutik sowie einem Hands-On, in dem wir mithilfe von transkribierten Interviews je nach Promting verschiedene Ausgabe- und Interpretationsmöglichkeiten der Daten getestet haben.

Am Abend war dann die beeindruckende Keynote von Mark Dingemanse im Programm, der das komplette Kontrastprogramm zu meinen bisher erlebten anderthalb und auch den noch folgenden Tagen bot. Er warnte mit erschreckenden Beispielen vor einem blinden Vertrauen gegenüber dem, was uns die LLMs als Antwort zurückgeben. Die immer größere Zahl an Nutzer*innen von Angeboten wie ChatGPT etc. und die daraus folgende „Weiterentwicklung“ durch u.a. die Aufnahme dieser Daten in das System, bedeutet laut Dingemanse einen zukünftigen Verlust von Sinn. Es werden so viele Daten produziert, dass es immer komplizierter werden wird, durch LLMs an greifbare, essenzielle Information zu kommen. Dazu brachte er ein Beispiel von den Brüdern Grimm und ihrer Geschichte „Der süße Brei“: Um an brauchbare Daten zu kommen, muss man sich durch den „ganzen Brei“ des entstandenen Datenmülls essen. Dingemanse plädierte für mehr „slow science“, also eine Wissenschaft, die zwar etwas länger dauert, dafür allerdings nicht auf Daten basiert, die man einfach mal so aus Antworten der LLMs übernommen hat.

Außerdem verkündete er der versammelten Digital-Humanities-Community, dass das Modell llama-3, das in meinen beiden Workshops genutzt wurde und auch so sehr häufig genutzt wird, da es für die bestehenden Fälle am effizientesten ist, mit das am schlechtesten bewertete in Sachen Datenschutz, Dokumentation, Lizenzierung, etc. ist. Es gehört auch zum Facebook-Mutterkonzern Meta. Vergleiche hierzu die Seite www.osai-index.eu des European Open Source AI Index. Sie bietet einen guten Überblick über alle bekannten und nutzbaren LLMs und bewertet sie nach 14 Kriterien, die jeder Person, die wissenschaftlich arbeitet, keinesfalls egal sein sollten.

Auch wenn diese Keynote eine einschlagende und zum Nachdenken anregende war, bin ich mir nicht sicher, ob seitdem ein Umdenken in der Community hin zur Nutzung anderer Modelle sichtbar geworden ist. Dies wäre eine wissenschaftliche Untersuchung wert.

Am Mittwoch begannen die Konferenzbeiträge. Ich war im Doctoral Consortium und habe mir dort sehr interessante Beiträge angehört. Einerseits zu einer Masterarbeit, die die Übersetzung und Digitalisierung der jiddischen Zeitschrift „Der Wahre Jude“ behandelte. Also genau mein Interessensgebiet, da mich mein regionales Interesse automatisch auch zu Dokumenten der jüdischen Gemeinden und damit dem Hebräischen führt. Des Weiteren wurde eine Dissertation vorgestellt, die über die Analyse von Mensch-KI-Interaktionen in Science-Fiction-Literatur mit besonderem Blick auf die Privatsphäre ging. Dieses Thema interessiert mich vor allem seit den Snowden-Enthüllungen 2013.

Wie auch schon bei den DHds 2022 und 2024, auf denen ich war, wollte ich weitere Personen kennenlernen, die ähnliche Forschungsinteressen haben wie ich. Eine Chance, kurze Gespräche zu führen, bot sich immer in den Kaffeepausen zwischen den Vortragsblöcken an. Es fand an diesem Tag jedoch auch das Treffen aller Stipendiand*innen und Nachwuchsforschenden statt. Hier wurden noch mal Tipps für den weiteren Austausch und die Vernetzungsmöglichkeiten u.a. von Promovierenden gegeben und ich konnte dabei bei einem Gespräch einige Tipps für meine Masterarbeit einholen.

Danach folgte noch die jährliche DHd-Mitglieder*innenversammlung. Eine sehr von Politik geprägte Veranstaltung, jedoch als Mitglied keineswegs unwichtig. So einer Mitgliederversammlung sollte man auf jeden Fall mal beigewohnt haben.

Am vorletzten Tag, dem Donnerstag, war ein interessanter buchwissenschaftlicher Vortrag zu hören, zur automatischen Erkennung von Bildern aus Kinderbüchern des 19. Jh. aus einer Datenbank von über elf Tausend Büchern. 

Bildgewaltig war auch die am Nachmittag stattfindende Postersession. Man hatte eigentlich gar nicht die Möglichkeit alle Poster intensiv zu studieren, weil einfach die Zeit dafür gefehlt hat, vor allem, wenn man sich von einer verantwortlichen Person etwas zu ihrem Poster hat erklären lassen. Diese Chance versuchte ich natürlich auch so gut wie möglich zu nutzen und war sehr erfreut, mit mir aus wissenschaftlichen Veröffentlichungen bekannten Personen Kontakt zu knüpfen. Beeindruckend war hier auch, dass sehr viele Plakate von Projekten mit Forschenden aus Mainz aufgestellt waren.

Der Donnerstagabend war nach der schon intensiven Postersession bezüglich sozialer Interaktion jedoch noch mal eine Stufe höher. Das sogenannte „Konferenzdinner“, das auf dem Papier so offiziell wirkt, waren lustigerweise nichts weiter als zwei Burgertrucks, auf dem Hinterhof eines klischeemäßigen, aber ebenso legendären „Hinter-dem-Bahnhof“-Clubs, in dem sich sehr interessante Gespräche ergaben. Sehr dankbar bin ich hier vor allem Sarah Lang, die mich weiteren interessanten Forschenden vorgestellt hat, z.B. Jürgen Hermes aus Köln, der in seiner Dissertation das sagenumwobene Voynich-Manuskript kryptologisch untersucht hat. Ein solches Nischenforschungsinteresse kommt nicht häufig vor und doch ist es auf besondere Weise mit Sarahs und meinem verknüpft. Sie kennt sich bestens mit alchemischen Schriften und Kryptographie aus und ich interessiere mich sehr für die Sammlung der Leipziger Zauberbücher in der dortigen UB – sodass uns Manuel Burghardt scherzhaft schon „die Alchemistin und der Zauberer“ genannt hat.

Der Abend war voller emotionaler Ereignisse für mich und zog sich deshalb viel länger als ich ursprünglich geplant hatte, weshalb ich dann am Freitag leider den Vortrag von Elisa Cugliana, auch aus Köln, gerade so verpasst habe. Sie hat über die Probleme der Digitalisierung des „Compendium Historiae“ durch seine verschiedenen Abbildungen, freien Textpassagen und Diagrammen referiert und dass hierfür eine neue Methode angewendet wird. Glücklicherweise gibt es zur DHd immer ein Nachschlagewerk mit zu allen Vorträgen gehörenden Artikeln. Anschreiben werde ich sie im Rahmen meiner Masterarbeit (oder auch zukünftigen Forschungen) auf jeden Fall mal.

Fazit

Nach dieser Woche bin ich ganz schön erschöpft. Ich habe viele Erfahrungen und neue Erkenntnisse mitgenommen. Schade jedoch, dass die Energie nicht gereicht hat, alles Interessante mitzunehmen. Wenn man es aber realistisch betrachtet, sollte man sich nicht vornehmen, alle Veranstaltungen besuchen zu wollen – allein schon, weil Vieles gleichzeitig stattfindet. Sonst gerät man in Stress und kriegt sowieso nicht alle Informationen aufgenommen, die einem erzählt werden. Ich denke, die Menge an besuchten Vorträgen und Veranstaltungen war für mich ganz gut, um die wichtigsten mitzunehmen, ohne mich zu überfordern.

Die DHd ist ein alljährliches Highlight der Zusammenkunft wichtiger Forschender aus den unterschiedlichsten Fachbereichen, welche aber zum großen Teil neue Erkenntnisse teilen, die fachübergreifend gelten und damit auch für andere Forschungsbereiche nutzbar und nützlich sind.

Eine absolute Empfehlung spreche ich auch für alle „Jungforschenden“ aus: Bewerbt Euch um Stipendienplätze! Das Treffen zwischen Menschen, die zu ähnlichen Themen forschen wie man selbst, ist einfach extrem wichtig, um sich mal austauschen und treffen zu können.

Als ebenso wichtig sehe ich die generellen Möglichkeiten der Unterhaltung mit Doktor*innen und Professor*innen an, die sehr niedrigschwellig, im Grunde auf Augenhöhe, stattfinden. Ich bin zwar immer noch sehr nervös, wenn ich mit Menschen sprechen möchte, deren Forschung ich seit Längerem verfolge, und sie dann auf der DHd sehe. Die Tatsache, dass aber alle Personen bisher sehr aufgeschlossen und nett zu mir waren, wenn ich mich dann getraut habe, sie anzusprechen, gibt mir sehr viel Kraft, um auch in Zukunft weiterhin auf Forschende zuzugehen, die mich beeindrucken, um sich über Erkenntnisse, Methoden und eventuelle Gemeinsamkeiten in Sachen Forschungsinteresse auszutauschen.

Auch thematisch war die diesjährige DHd für meine bevorstehende Masterarbeit sehr interessant. So habe ich eine gute Wissensgrundlage für sie, wie auch für meine weitere Forschung erlangen können.

Das Titelwort „Wissenswasserfälle“ würde ich als generelles Phänomen der jährlich stattfindenden DHds ansehen. Man hat am Ende immer das Gefühl, zu wenig mitbekommen zu haben, aber ein Mensch kann eben nur eine gewisse Menge an Informationen aufnehmen, ohne sich in Stress zu versetzen oder sich zu überfordern. Die Vorträge, die Postersession, der Posterslam, etc. sind trotz und aufgrund der Menge an bereitgestelltem Wissen auch einfach schöne Ereignisse, die man sich sehr gerne anschaut, da man gespannt ist „was es so Neues gibt“.

Um alles Interessante noch mal nachlesen zu können, würde ich neben den weiteren Berichten über die Tagung (z.B. hier bei dem schon erwähnten Jürgen Hermes) natürlich auch das Book of Abstracts empfehlen.

Macht es gut!

Bis Ende Februar 2026 in Wien. Ich freue mich schon mega!

OCR-Sprechstunde meets Law: Love Data Week Special am 13. Februar 2025

2025年1月27日 17:09

Im Rahmen der Love Data Week 2025 lädt Sie das Kompetenzzentrum OCR der Universitätsbibliotheken Tübingen und Mannheim zu einer speziellen Veranstaltung unserer OCR-Sprechstunde ein! Am Donnerstag, den 13. Februar 2025 stehen wir Ihnen diesmal etwas länger von 15:00 bis 16:30 Uhr über Zoom zur Verfügung.

Neben Ihren Fragen zur automatischen Texterkennung von Handschriften und Druckschriften werden Ihnen spannende Einblicke und Hinweise zu rechtlichen Aspekten von der Digitalisierung über die Volltexterkennung bis hin zur Bereitstellung und Nachnutzung der Volltexte durch die Juristin Vasilka Stoilova (UB Mannheim & BERD@NFDI) geboten. Nutzen Sie die Gelegenheit, Ihre rechtlichen Fragen zum Thema OCR an eine Expertin zu richten.

Seien Sie dabei und nehmen Sie ohne Anmeldung über folgenden Link teil:
🔗https://ocr-bw.bib.uni-mannheim.de/sprechstunde
(Meeting-ID: 682 8185 1819, Kenncode: 443071)

Haben Sie Fragen? Kontaktieren Sie gerne Larissa Will unter:
📧 larissa.will(at)uni-mannheim.de

Wir sind gespannt, welche Fragen und Themen uns dieses Mal erwarten!

Nächste Offene OCR-Sprechstunde am 14. März von 15 bis 16 Uhr

2024年3月5日 19:09

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 14. März 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Weitere Informationen zum Thema OCR finden Sie unter: https://ocr-bw.bib.uni-mannheim.de/.

Wenn Sie über unsere Angebote zum Thema automatische Texterkennung auf dem Laufenden bleiben möchten, tragen Sie sich in unsere Mailingliste ein: https://listserv.uni-tuebingen.de/mailman/listinfo/ocr_htr_ub.

Wir freuen uns auf Ihre Teilnahme!

Erste OCR-Sprechstunde im neuen Jahr: 11. Januar zwischen 15 und 16 Uhr

2024年1月4日 22:40

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 11. Januar 2024 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Weitere Informationen zum Thema OCR finden Sie unter: https://ocr-bw.bib.uni-mannheim.de/.

Wenn Sie über unsere Angebote zum Thema automatische Texterkennung auf dem Laufenden bleiben möchten, tragen Sie sich in unsere Mailingliste ein: https://listserv.uni-tuebingen.de/mailman/listinfo/ocr_htr_ub.

Wir freuen uns auf Ihre Teilnahme!

Nächste offene OCR-Sprechstunde am 12. Oktober 2023 von 15 bis 16 Uhr

2023年10月10日 22:18

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 12. Oktober 2023 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Larissa Will (larissa.will(at)uni-mannheim.de).

Weitere Informationen zum Thema OCR finden Sie unter: https://ocr-bw.bib.uni-mannheim.de/.

Wenn Sie über unsere Angebote zum Thema automatische Texterkennung auf dem Laufenden bleiben möchten, tragen Sie sich in unsere Mailingliste ein: https://listserv.uni-tuebingen.de/mailman/listinfo/ocr_htr_ub.

Wir freuen uns auf Ihre Teilnahme!

Zurück aus der Sommerpause: offene OCR-Sprechstunde am 14. September 2023

2023年8月29日 22:07

Das Kompetenzzentrum OCR, bestehend aus der UB Tübingen und der UB Mannheim, unterstützt und berät seit drei Jahren bei der Anwendung aktueller Programme zur Texterkennung.

Für einen unkomplizierten Einstieg in das Thema bieten wir für alle Interessierten jeden zweiten Donnerstag im Monat von 15 bis 16 Uhr eine offene OCR-Sprechstunde via Zoom an, in der Sie Ihre Fragen rund um das Thema automatisierte Texterkennung stellen können.

Die nächste Sprechstunde findet am Donnerstag, dem 14. September 2023 statt.

Sie können dem Meeting ohne vorherige Anmeldung unter folgendem Link beitreten: https://ocr-bw.bib.uni-mannheim.de/sprechstunde (Meeting-ID: 682 8185 1819, Kenncode: 443071).

Sollten Sie technische Probleme oder Fragen haben, wenden Sie sich an Jan Kamlah (jan.kamlah(at)uni-mannheim.de).

Weitere Informationen zum Thema OCR finden Sie unter: https://ocr-bw.bib.uni-mannheim.de/.

Wenn Sie über unsere Angebote zum Thema automatische Texterkennung auf dem Laufenden bleiben möchten, tragen Sie sich in unsere Mailingliste ein: https://listserv.uni-tuebingen.de/mailman/listinfo/ocr_htr_ub.

Wir freuen uns auf Ihre Teilnahme!

❌