普通视图

Received yesterday — 2026年2月3日

Workshop: LLMs für die Geisteswissenschaften (Mainz, 19./20.03.)

2026年2月2日 19:54

Arbeitet ihr mit Textdaten und wollt herausfinden, wie ihr diese mit Large Language Models verarbeiten, anreichern und analysieren könnt? Habt ihr Lust, mit euren Daten praktisch zu arbeiten und dabei Unterstützung zu bekommen? Dann kommt zum nächsten Bring Your Own Data Lab (BYODL) des HERMES | Humanities Education in Research, Data, and Methods Datenkompetenzzentrums am DH Lab des Leibniz-Instituts für Europäische Geschichte in Mainz! In dem Workshop geht es um spezialisierte Large Language Models und spezialisiertes Prompting für die Geisteswissenschaften.

Das Wichtigste in Kürze:

📅 19.–20. März 2026 (Do, 10:00 bis Fr, 16:00)
📍 Präsenz-Workshop: Leibniz-Institut für Europäische Geschichte, Mainz

Was euch erwartet:
🛠 Hands-on-Sessions: Praktisches Arbeiten mit Euren eigenen Datensätzen
🔎 Vertiefung spezifischer LLM-Themen und Anwendungsfälle
🤝 Kollegialer Austausch, Peer-Feedback und gezielte fachliche Unterstützung

Expertinnen:
Sarah Oberbichler (C²DH), Johanna Mauermann (IEG DH LabHERMES), Lauren Coetzee (C²DH)

Alle aktuellen Informationen findet Ihr auf der HERMES-Veranstaltungsseite.

Ziele und Inhalt:

In verschiedenen Impulsvorträgen und Hands-on-Sessions lernen Teilnehmende, wie sie offene, auf die geisteswissenschaftliche Forschung spezialisierte und lokale Modelle mit ihren eigenen Daten verwenden können und wie sie Prompts an geisteswissenschaftliche Fragen anpassen können. Ebenfalls reflektieren wir, wie Daten für ein Fine-Tuning oder Post-Training eines kleinen Sprachmodells aufbereitet werden können.

Voraussetzungen:

Der Workshop richtet sich an Forschende der Geisteswissenschaften, die mit Textdaten arbeiten. Vorausgesetzt werden grundlegende Kenntnisse im Bereich generativer KI. Die mitgebrachten Daten sollten maschinenlesbar vorliegen.

Wir werden in manchen Hands-on-Sessions mit Jupyter Notebooks und Python sowie mit Hugging Face arbeiten. Die Teilnahme ist auch ohne vertiefte Kenntnisse in diesen Bereich möglich. Selbstlernmaterial zur Vorbereitung wird angeboten.

Kontakt und Anmeldung:

Zur Registrierung und bei Fragen: Johanna Mauermann, hermes@ieg-mainz.de

Bitte gebt bei der Anmeldung folgende Informationen an:

  • Fachgebiet
  • Welche Erfahrung habt ihr mit generativer KI?
  • Welche Art von Daten bringen ihr mit?

Hinweis: Die Teilnehmerzahl ist auf maximal 15 Personen begrenzt.

Die Anmeldung ist bis zum 09. März 2026 geöffnet.

Der Workshop findet überwiegend auf Deutsch statt, einzelne Impulse werden auf Englisch sein.

Received before yesterday

Wissenswasserfälle in Bielefeld

2025年9月3日 04:05

Mein persönlicher Bericht von der DHd 2025


Kurzvorstellung

Hallo liebe Forschende,

mein Name ist Jan Eberhardt und als Studierender des Masters Digitale Methodik in den Geistes- und Kulturwissenschaften in Mainz hatte ich die Ehre, an der jährlichen Konferenz der Digital Humanities im deutschsprachigen Raum (DHd) 2025 in Bielefeld teilzunehmen. Die Reise- und Unterkunftskosten wurden durch ein Stipendium von NFDI4memory gefördert.

Meinen Bachelor absolvierte ich ebenfalls in Mainz, im Studiengang Buchwissenschaft, weshalb ich mich dazu entschieden habe, nach diesem Post auf dem DHd-Blog im Idealfall auf meinem eigenen Blog vor allem über Neuigkeiten zur Forschung aus diesen Fachbereichen zu berichten.

Ende des Jahres möchte ich mit meiner Masterarbeit beginnen und es macht für mich absolut Sinn, das gelernte aus beiden Studiengängen miteinander zu verknüpfen und mit der Welt zu teilen, anstatt nur vor meinen eigenen Stichpunkten zu sitzen.

Bericht von der DHd 2025

Mein Vorhaben auf der diesjährigen DHd bestand darin, alle Informationen mitzunehmen, die meine Fachbereiche und mein Forschungsinteresse miteinander verbinden, oder die ich in der späteren Forschung nutzen kann. Das war ein sehr ambitioniertes Ziel, wie ich in dieser Woche feststellen musste. Um die Länge dieses Blogposts auch nicht zu lang werden zu lassen, werde ich versuchen, mich vor allem auf meine persönlichen Erkenntnisse beschränken. Aber der Reihe nach:

Das Thema, das die gesamte Konferenz mit dem Untertitel „under construction“ überlagerte, waren Large Language Models (LLMs), da sie in den vergangenen Jahren in vielen Bereichen der Forschung getestet und diese Ergebnisse nun vorgestellt wurden.

Montags begann die Konferenzwoche direkt mit dem Workshop „eScriptorium meets LLMs: Moderne KI-Systeme im Kontext der Volltexterschließung“ von Forschenden der Universitätsbibliothek Mannheim, mit einem interessanten Beispiel zur Post-Correction von OCR-Ergebnissen und der Nutzung von LLMs für Named Entity Recognition (NER), also der automatischen Erkennung und Deklarierung von z.B. Namen oder Orte als solche.

Das Thema Texterschließung von Handschriften und Drucken aus dem Mittelalter und der Frühen Neuzeit ist für mich von besonderem Interesse, da ich mich für die Masterarbeit mit einem Text aus dieser Zeit befassen werde. Des Weiteren habe ich sehr großes Interesse an der nachnutzbaren Digitalisierung und dem weiterem Einsatz Digitaler Methoden, wie der von mir schon im Studium verwendeten NER, an Dokumenten aus meiner Heimatregion Rheinhessen, die bekanntermaßen eine sehr bedeutende Geschichte aufweist. 

Dienstags gab es einen ganztägigen Workshop mit einem sehr theoretischen Teil zur Definition von Ground Truth und Hermeneutik sowie einem Hands-On, in dem wir mithilfe von transkribierten Interviews je nach Promting verschiedene Ausgabe- und Interpretationsmöglichkeiten der Daten getestet haben.

Am Abend war dann die beeindruckende Keynote von Mark Dingemanse im Programm, der das komplette Kontrastprogramm zu meinen bisher erlebten anderthalb und auch den noch folgenden Tagen bot. Er warnte mit erschreckenden Beispielen vor einem blinden Vertrauen gegenüber dem, was uns die LLMs als Antwort zurückgeben. Die immer größere Zahl an Nutzer*innen von Angeboten wie ChatGPT etc. und die daraus folgende „Weiterentwicklung“ durch u.a. die Aufnahme dieser Daten in das System, bedeutet laut Dingemanse einen zukünftigen Verlust von Sinn. Es werden so viele Daten produziert, dass es immer komplizierter werden wird, durch LLMs an greifbare, essenzielle Information zu kommen. Dazu brachte er ein Beispiel von den Brüdern Grimm und ihrer Geschichte „Der süße Brei“: Um an brauchbare Daten zu kommen, muss man sich durch den „ganzen Brei“ des entstandenen Datenmülls essen. Dingemanse plädierte für mehr „slow science“, also eine Wissenschaft, die zwar etwas länger dauert, dafür allerdings nicht auf Daten basiert, die man einfach mal so aus Antworten der LLMs übernommen hat.

Außerdem verkündete er der versammelten Digital-Humanities-Community, dass das Modell llama-3, das in meinen beiden Workshops genutzt wurde und auch so sehr häufig genutzt wird, da es für die bestehenden Fälle am effizientesten ist, mit das am schlechtesten bewertete in Sachen Datenschutz, Dokumentation, Lizenzierung, etc. ist. Es gehört auch zum Facebook-Mutterkonzern Meta. Vergleiche hierzu die Seite www.osai-index.eu des European Open Source AI Index. Sie bietet einen guten Überblick über alle bekannten und nutzbaren LLMs und bewertet sie nach 14 Kriterien, die jeder Person, die wissenschaftlich arbeitet, keinesfalls egal sein sollten.

Auch wenn diese Keynote eine einschlagende und zum Nachdenken anregende war, bin ich mir nicht sicher, ob seitdem ein Umdenken in der Community hin zur Nutzung anderer Modelle sichtbar geworden ist. Dies wäre eine wissenschaftliche Untersuchung wert.

Am Mittwoch begannen die Konferenzbeiträge. Ich war im Doctoral Consortium und habe mir dort sehr interessante Beiträge angehört. Einerseits zu einer Masterarbeit, die die Übersetzung und Digitalisierung der jiddischen Zeitschrift „Der Wahre Jude“ behandelte. Also genau mein Interessensgebiet, da mich mein regionales Interesse automatisch auch zu Dokumenten der jüdischen Gemeinden und damit dem Hebräischen führt. Des Weiteren wurde eine Dissertation vorgestellt, die über die Analyse von Mensch-KI-Interaktionen in Science-Fiction-Literatur mit besonderem Blick auf die Privatsphäre ging. Dieses Thema interessiert mich vor allem seit den Snowden-Enthüllungen 2013.

Wie auch schon bei den DHds 2022 und 2024, auf denen ich war, wollte ich weitere Personen kennenlernen, die ähnliche Forschungsinteressen haben wie ich. Eine Chance, kurze Gespräche zu führen, bot sich immer in den Kaffeepausen zwischen den Vortragsblöcken an. Es fand an diesem Tag jedoch auch das Treffen aller Stipendiand*innen und Nachwuchsforschenden statt. Hier wurden noch mal Tipps für den weiteren Austausch und die Vernetzungsmöglichkeiten u.a. von Promovierenden gegeben und ich konnte dabei bei einem Gespräch einige Tipps für meine Masterarbeit einholen.

Danach folgte noch die jährliche DHd-Mitglieder*innenversammlung. Eine sehr von Politik geprägte Veranstaltung, jedoch als Mitglied keineswegs unwichtig. So einer Mitgliederversammlung sollte man auf jeden Fall mal beigewohnt haben.

Am vorletzten Tag, dem Donnerstag, war ein interessanter buchwissenschaftlicher Vortrag zu hören, zur automatischen Erkennung von Bildern aus Kinderbüchern des 19. Jh. aus einer Datenbank von über elf Tausend Büchern. 

Bildgewaltig war auch die am Nachmittag stattfindende Postersession. Man hatte eigentlich gar nicht die Möglichkeit alle Poster intensiv zu studieren, weil einfach die Zeit dafür gefehlt hat, vor allem, wenn man sich von einer verantwortlichen Person etwas zu ihrem Poster hat erklären lassen. Diese Chance versuchte ich natürlich auch so gut wie möglich zu nutzen und war sehr erfreut, mit mir aus wissenschaftlichen Veröffentlichungen bekannten Personen Kontakt zu knüpfen. Beeindruckend war hier auch, dass sehr viele Plakate von Projekten mit Forschenden aus Mainz aufgestellt waren.

Der Donnerstagabend war nach der schon intensiven Postersession bezüglich sozialer Interaktion jedoch noch mal eine Stufe höher. Das sogenannte „Konferenzdinner“, das auf dem Papier so offiziell wirkt, waren lustigerweise nichts weiter als zwei Burgertrucks, auf dem Hinterhof eines klischeemäßigen, aber ebenso legendären „Hinter-dem-Bahnhof“-Clubs, in dem sich sehr interessante Gespräche ergaben. Sehr dankbar bin ich hier vor allem Sarah Lang, die mich weiteren interessanten Forschenden vorgestellt hat, z.B. Jürgen Hermes aus Köln, der in seiner Dissertation das sagenumwobene Voynich-Manuskript kryptologisch untersucht hat. Ein solches Nischenforschungsinteresse kommt nicht häufig vor und doch ist es auf besondere Weise mit Sarahs und meinem verknüpft. Sie kennt sich bestens mit alchemischen Schriften und Kryptographie aus und ich interessiere mich sehr für die Sammlung der Leipziger Zauberbücher in der dortigen UB – sodass uns Manuel Burghardt scherzhaft schon „die Alchemistin und der Zauberer“ genannt hat.

Der Abend war voller emotionaler Ereignisse für mich und zog sich deshalb viel länger als ich ursprünglich geplant hatte, weshalb ich dann am Freitag leider den Vortrag von Elisa Cugliana, auch aus Köln, gerade so verpasst habe. Sie hat über die Probleme der Digitalisierung des „Compendium Historiae“ durch seine verschiedenen Abbildungen, freien Textpassagen und Diagrammen referiert und dass hierfür eine neue Methode angewendet wird. Glücklicherweise gibt es zur DHd immer ein Nachschlagewerk mit zu allen Vorträgen gehörenden Artikeln. Anschreiben werde ich sie im Rahmen meiner Masterarbeit (oder auch zukünftigen Forschungen) auf jeden Fall mal.

Fazit

Nach dieser Woche bin ich ganz schön erschöpft. Ich habe viele Erfahrungen und neue Erkenntnisse mitgenommen. Schade jedoch, dass die Energie nicht gereicht hat, alles Interessante mitzunehmen. Wenn man es aber realistisch betrachtet, sollte man sich nicht vornehmen, alle Veranstaltungen besuchen zu wollen – allein schon, weil Vieles gleichzeitig stattfindet. Sonst gerät man in Stress und kriegt sowieso nicht alle Informationen aufgenommen, die einem erzählt werden. Ich denke, die Menge an besuchten Vorträgen und Veranstaltungen war für mich ganz gut, um die wichtigsten mitzunehmen, ohne mich zu überfordern.

Die DHd ist ein alljährliches Highlight der Zusammenkunft wichtiger Forschender aus den unterschiedlichsten Fachbereichen, welche aber zum großen Teil neue Erkenntnisse teilen, die fachübergreifend gelten und damit auch für andere Forschungsbereiche nutzbar und nützlich sind.

Eine absolute Empfehlung spreche ich auch für alle „Jungforschenden“ aus: Bewerbt Euch um Stipendienplätze! Das Treffen zwischen Menschen, die zu ähnlichen Themen forschen wie man selbst, ist einfach extrem wichtig, um sich mal austauschen und treffen zu können.

Als ebenso wichtig sehe ich die generellen Möglichkeiten der Unterhaltung mit Doktor*innen und Professor*innen an, die sehr niedrigschwellig, im Grunde auf Augenhöhe, stattfinden. Ich bin zwar immer noch sehr nervös, wenn ich mit Menschen sprechen möchte, deren Forschung ich seit Längerem verfolge, und sie dann auf der DHd sehe. Die Tatsache, dass aber alle Personen bisher sehr aufgeschlossen und nett zu mir waren, wenn ich mich dann getraut habe, sie anzusprechen, gibt mir sehr viel Kraft, um auch in Zukunft weiterhin auf Forschende zuzugehen, die mich beeindrucken, um sich über Erkenntnisse, Methoden und eventuelle Gemeinsamkeiten in Sachen Forschungsinteresse auszutauschen.

Auch thematisch war die diesjährige DHd für meine bevorstehende Masterarbeit sehr interessant. So habe ich eine gute Wissensgrundlage für sie, wie auch für meine weitere Forschung erlangen können.

Das Titelwort „Wissenswasserfälle“ würde ich als generelles Phänomen der jährlich stattfindenden DHds ansehen. Man hat am Ende immer das Gefühl, zu wenig mitbekommen zu haben, aber ein Mensch kann eben nur eine gewisse Menge an Informationen aufnehmen, ohne sich in Stress zu versetzen oder sich zu überfordern. Die Vorträge, die Postersession, der Posterslam, etc. sind trotz und aufgrund der Menge an bereitgestelltem Wissen auch einfach schöne Ereignisse, die man sich sehr gerne anschaut, da man gespannt ist „was es so Neues gibt“.

Um alles Interessante noch mal nachlesen zu können, würde ich neben den weiteren Berichten über die Tagung (z.B. hier bei dem schon erwähnten Jürgen Hermes) natürlich auch das Book of Abstracts empfehlen.

Macht es gut!

Bis Ende Februar 2026 in Wien. Ich freue mich schon mega!

KI Showcase: Der Chatbot „ParzivAI“

2024年9月24日 17:02
Am 22.07.24 stellten Dr. Florian Nieser und Dr. Thomas Renkert die Alpha-Version des von ihnen entwickelten Chatbots ParzivAI vor. ParzivAI ist auf die Vermittlung der mittelhochdeutschen Sprache und Geschichtsdidaktik des Mittelalters spezialisiert und besteht...

💾

Virtuelles DH-Kolloquium an der BBAW, 29.04.2024: „‚Kurios und faszinierend‘. Prompt Engineering als Arbeits- und Forschungsmethode“

2024年4月15日 15:54

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 29. April 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Christopher Pollin (Universität Graz)

„Prompting is weird. Prompting matters”, schreibt Ethan Mollick, Professor für Innovation, Entrepreneurship und KI an der Wharton School (USA), in seinem Blog. Der Einsatz von künstlicher Intelligenz in den Digital Humanities hat mit den Fortschritten im Bereich der Large Language Models (LLM) eine neue Stufe erreicht. Prompt Engineering, d.h. die Optimierung der Eingabe in ein LLM, um die „besten” Antworten zu erhalten, kann die Ergebnisse des LLM erheblich verbessern – auch wenn es manchmal kurios erscheint, was der „beste” Prompt ist. Insbesondere „Agentic Workflows” bieten weiteres Potenzial, den Output eines LLM deutlich zu verbessern. Darunter wird die Simulation von Agenten durch Modelle wie GPT-4 oder Claude 3 verstanden, die Entscheidungen treffen, Aktionen festlegen, Werkzeuge benutzen und zusammenarbeiten. Der Vortrag diskutiert Prompting Engineering und Agentic Workflows als Arbeits- und Forschungsmethode anhand verschiedener Beispiele aus den Digital Humanities, aber auch aus anderen Disziplinen wie der Psychologie oder Bereichen der Musik- und Bildgenerierung. Durch Prompting Engineering erzielen Modelle wie GPT-4 spannende Ergebnisse in den Bereichen Modellierung, Datengenerierung, Codegenerierung, Datenextraktion oder Datenanalyse. Welche Voraussetzungen müssen geschaffen werden und welche Herausforderungen bringen die neuen Arbeitsmethoden, die sich mit LLMs ergeben, mit sich?

Kurzbericht zum Hackathon ‘KI und Mittelalter’

2024年2月16日 15:25
Der Hackathon zum Thema ‚Mittelalter und KI‘ fand am 05.02.24 in den Räumlichkeiten der Pädagogischen Hochschule (PH) Heidelberg und der Heidelberg School of Education (HSE) statt. Dieses Zusammenkommen einiger Expert*innen aus verschiedenen Fachbereichen wurde...

[Aktuelles] Kurzbericht zum Auftakt der Reihe ‘KI in Anwendung’ (HSE und HCDH) mit Dr. Sarah Schwettmann

2023年12月1日 17:51
Der Workshop „Fortgeschrittener KI-Einsatz in der Hochschullehre“ fand am vergangenen Freitag, dem 24.11.2023 im Gebäude des Heidelberg Center for Transcultural Studies (HCTS) statt. Die Veranstaltung war der Auftakt zur Veranstaltungsreihe ‘KI in Anwendung’, die...

Virtuelles DH-Kolloquium an der BBAW, 29.01.2024: Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

2024年1月17日 21:00

Im Rahmen des DH-Kolloquiums an der BBAW laden wir Sie herzlich zum nächsten Termin am Montag, den 29. Januar 2024, 16 Uhr c.t., ein (virtueller Raum: https://meet.gwdg.de/b/lou-eyn-nm6-t6b):

Noah Bubenhofer (Universität Zürich)
über
Large Language Models, künstliche Intelligenz. Veränderungen des wissenschaftlichen Schreibens und Forschens – ein (korpus-)linguistischer Blick

***

Seit der Lancierung von ChatGPT befasst sich die breite Öffentlichkeit mit sog. Large Language Models (Sprachmodellen) und streitet über die Chancen und Gefahren dieser Technologie. In meinem Vortrag möchte ich einen linguistischen Blick auf diese Technologie werfen und fragen: Wie verändert sich der Umgang mit Text in der Wissenschaft und welche neuen Möglichkeiten ergeben sich in der Forschung? In der Korpus- und Computerlinguistik ist uns die Arbeit mit Sprachmodellen seit einiger Zeit vertraut, da sie dazu dienen, Sprachgebrauch zu modellieren und zu untersuchen. In ihrer heutigen, interaktiven Form, sind Sprachmodelle jedoch mehr als eine Repräsentation von Sprachgebrauch. Dies soll im Vortrag ebenfalls thematisiert werden.

***

Die Veranstaltung findet virtuell statt; eine Anmeldung ist nicht notwendig. Zum Termin ist der virtuelle Konferenzraum über den Link https://meet.gwdg.de/b/lou-eyn-nm6-t6b erreichbar. Wir möchten Sie bitten, bei Eintritt in den Raum Mikrofon und Kamera zu deaktivieren. Nach Beginn der Diskussion können Wortmeldungen durch das Aktivieren der Kamera signalisiert werden.

Der Fokus der Veranstaltung liegt sowohl auf praxisnahen Themen und konkreten Anwendungsbeispielen als auch auf der kritischen Reflexion digitaler geisteswissenschaftlicher Forschung. Weitere Informationen finden Sie auf der Website der BBAW.

❌