普通视图

Received before yesterday

Compartir Pantalla con Pablo Ruiz Fabo. 18 de noviembre de 2025

2025年10月31日 05:48

Compartir Pantalla

Be API: Usar LLMs pasando de la interfaz

18 DE NOVIEMBRE DE 2025 – 19:00 (GMT+1)

Pablo Ruiz Fabo

Université de Strasbourg

Pablo Ruiz Fabo es profesor (Maître de conférences) en el Departamento de tecnologías lingüísticas y humanidades digitales de la Universidad de Estrasburgo desde 2018. Su investigación se basa en aplicaciones del procesamiento del lenguaje natural (PLN) a las humanidades digitales.

Ha trabajado sobre aplicaciones de PLN al análisis literario (poesía y teatro) y a la automatización de la creación de corpus digitales. Actualmente realiza un proyecto de estudios literarios computacionales en el CiTIUS – Universidad de Santiago de Compostela apoyado por el programa Marie Skłodowska-Curie.

Resumen de la intervención

Se presenta cómo usar las API de plataformas de LLM populares (OpenAI y otras), con ejemplos sencillos de código en Google Colab. También se presenta el uso de modelos locales (que no están alojados en una plataforma). La utilidad de esto es automatizar el trabajo: Las consultas a los LLMs se hacen automáticamente para un número arbitrario de casos, y las respuestas se pueden tratar en masa automáticamente. Se ofrecerán ejemplos prácticos sobre cómo aplicarlos a corpus en humanidades digitales, especialmente en ámbitos de comunicación y medios, asi como clasificación de poemas.

La entrada Compartir Pantalla con Pablo Ruiz Fabo. 18 de noviembre de 2025 se publicó primero en HDH - Humanidades Digitales Hispánicas.

Compartir Pantalla con Ricardo Pichel y Víctor Caballero Gómez. 22 de octubre de 2024

2024年10月8日 21:17

Compartir Pantalla

El Escritorio Galego-Portugués Antiguo (EGPA) y su flujo de trabajo: de la edición a la explotación

corpora.uah.es/egpa/

22 DE OCTUBRE DE 2024 – 19:00 (GMT+2)

Ricardo Pichel

Es profesor del Departamento de Literatura Española y Teoría de la Literatura de la UNED. Asimismo, es doctor en Filología Gallega por la Universidade de Santiago de Compostela, de la que continúa siendo investigador colaborador externo, y ha estado igualmente vinculado a la Universidad Complutense de Madrid y a la Universidad de Alcalá con diferentes contratos de investigación. Entre sus áreas de investigación destacan el estudio del patrimonio cultural hispánico, la edición y estudio de fuentes archivísticas medievales y modernas, la literatura medieval hispánica, las humanidades digitales, la edición digital, la historia de la lengua, la paleografía, la codicología y la filología material.

Víctor Caballero Gómez

Es investigador predoctoral del Instituto de Estudios Medievales y Renacentistas y de Humanidades Digitales de la Universidad de Salamanca. Del mismo modo, ha sido investigador contratado en la Universidad de Alcalá y en la Universidad de Sevilla. Cursó estudios de Máster en Patrimonio Histórico Escrito y de Grado en Historia en la Universidad Complutense de Madrid. Su interés investigador se centra en las metodologías que facilitan el desarrollo de corpus históricos y que permiten realizar estudios cuantitativos a partir de ellos.

Resumen de la intervención

El Escritorio Galego-Portugués Antigo (EGPA) se concibe como una plataforma abierta y colaborativa desde la que consultar diferentes corpus y repositorios de variadas características y contenidos, todos ellos centrados en la producción escrita vinculada a Galicia y Portugal desde la Edad Media hasta el siglo XIX. Cuenta tanto con fuentes documentales (EGPAdoc) como con fuentes literarias (EGPAlit), editadas, igualmente, según los criterios de la Red CHARTA, adaptados en algún caso a las especificidades de la variedad lingüística mayoritariamente representada. En la sesión abordaremos estas particularidades y mostraremos el flujo de trabajo empleado, para lo que incidiremos especialmente en las opciones de búsqueda y en los recursos con los que se facilita la edición digital y el etiquetado de los textos.

Compartir Pantalla con Fernando Sanz-Lázaro. 14 de mayo de 2024

2024年4月24日 21:07

Compartir Pantalla

De PDF a XML-TEI automática y rápidamente

14 DE MAYO DE 2024 – 19:00 (GMT+2)

Fernando Sanz-Lázaro

Fernando Sanz Lázaro está adscrito al Austrian Centre for Digital Humanities de las Academia Austriaca de las Ciencias, donde actualmente trabaja en un proyecto de edición digital y archivado de cantorales manuscritos. Se doctoró en Estudios Romances en la Universidad de Viena con una tesis sobre métodos digitales para extraer y organizar información estructural y prosódica de obras teatrales áureas, cuyos resultados, junto con otras aproximaciones léxicas, ha aplicado a la estilística cuantitativa.

Resumen de la intervención

Este Compartir Pantalla presentará mediante un ejemplo práctico una cadena de trabajo para procesar obras teatrales en verso partiendo de un archivo de texto puro y obtener datos estructurados anotados con información dramática, léxica y métrica. El objetivo es codificar rápidamente en XML-TEI o tabular en un archivo CSV el archivo de texto sin estructura para posibilitar análisis digitales complejos y, al mismo tiempo, minimizar el trabajo manual que requiere la tarea. Para ello, nos valdremos de un editor de texto con soporte de sustitución mediante expresiones regulares y una instalación de Python 3 reciente.

Compartir Pantalla con Albina Sarymsákova. 6 de febrero de 2024

2024年1月30日 23:22

Compartir Pantalla

PAFe: Un software para evaluar y mejorar la pronunciación en español como L2

6 DE FEBRERO DE 2024 – 19:00 (GMT+1)

Albina Sarymsákova

Albina Sarymsákova es graduada en Filología Hispánica por la Universidad Federal de Kazán (Rusia), con el Máster en Lingüística Aplicada y el Doctorado en Estudios Lingüísticos de la Universidade da Coruña. Actualmente trabajo como investigadora postdoctoral afiliada al proyecto europeo “DeepR3.gal: Reducir, Reutilizar, e Reciclar modelos grandes para desenvolver tecnologías del lenguaje responsables e verdes” (TED2021-130295B-C33) en el Centro Singular de Investigación en Tecnologías Inteligentes (CiTIUS) de Universidade de Santiago de Compostela. Sus principales líneas de investigación son el análisis multimodal del discurso, el entrenamiento de modelos lingüísticos para anotación morfo-sintáctica automática, el análisis melódico del habla, la extracción de patrones melódicos y la evaluación automática de la pronunciación.

Resumen de la intervención

PAFe (Plugin para el análisis fonético-fonológico en español) <https://gitlab.com/tamaracf/herramienta-para-el-analisis-de-la-pronunciacion-espanola> es un plugin software para usar con la suite de software libre para estudios fonéticos Praat (https://www.fon.hum.uva.nl/praat/ ), desarrollado para el análisis de patrones melódicos de hablantes nativos y no nativos de español y que facilita resultados de similitud en producción de la entonación entre ellos. En este Compartir pantalla se mostrará como usar PAFe con ejemplos prácticos para obtener datos de similitud en entonación y se revelarán las ventajas de dicha herramienta tanto para su uso en el contexto didáctico de segundas lenguas, como para su empleo en las investigaciones lingüísticas.

Compartir Pantalla con Gustavo Candela. 14 de noviembre de 2023

2023年10月13日 17:36

Compartir Pantalla: Linked Open Data y SPARQL

14 DE NOVIEMBRE DE 2023 – 19:00 (GMT+1)

Gustavo Candela

Gustavo Candela ha realizado labores de investigación y desarrollo en la Biblioteca Virtual Miguel de Cervantes desde 2010 y actualmente es Profesor Ayudante Doctor en la Universidad de Alicante. Obtuvo su título de Doctor en Informática en 2019. Ha realizado una estancia postdoctoral en la Biblioteca Nacional de Escocia. Su investigación se basa en la publicación, enriquecimiento y calidad de datos abiertos y enlazados (Linked Open Data) en instituciones de patrimonio cultural. Colabora con numerosas instituciones para publicar colecciones digitales que facilitan el acceso computacional (Collections as data). Ha publicado artículos en congresos internacionales y revistas JCR y es coautor del libro Open a GLAM Lab.

Resumen de la intervención

Las instituciones de patrimonio cultural han promovido desde hace décadas la publicación de sus colecciones digitales que incluyen texto, metadatos, imágenes, mapas o audio. En este sentido, y con el objetivo de facilitar la reutilización y el acceso computacional, se han explorado varias iniciativas como los conceptos de Lab y Collections as Data. En los últimos años varias propuestas en bibliotecas nacionales se han centrado en la publicación de plataformas digitales de edición colaborativa para corregir el texto digitalizado (OCR). Otras alternativas se han orientado hacia plataformas existentes de edición colaborativa, en particular, Wikidata que ha tenido mucho éxito en el ámbito bibliotecario. Su objetivo es facilitar a la comunidad global la posibilidad de editar y enriquecer las colecciones digitales como son el caso de textos y metadatos.

En este Compartir Pantalla, se expondrá una experiencia con Wikidata para el enriquecimiento de datos, así como una breve introducción al lenguaje de consulta SPARQL. También se presentarán ejemplos adicionales de modelado de datos y visualización en Wikidata basados en la Biblioteca Virtual Miguel de Cervantes, la International GLAM Labs Community y la Biblioteca Nacional de Escocia. Además, la conversación versará sobre los desafíos actuales del uso de Wikidata en lo que respecta a la calidad así como las limitaciones en las consultas.

Podéis encontrar todos los ejemplos presentados por nuestro invitado en el repositorio GitHub preparado para la sesión aquí así como las diapositivas presentadas aquí.

Compartir Pantalla con Ana García Serrano. 4 de julio de 2023

2023年6月21日 16:16

Compartir Pantalla: Transkribus

4 DE JULIO DE 2023 – 19:00 (GMT+2)

Ana García Serrano

Profesora Titular de la Universidad Nacional de Educación a Distancia en la Escuela Técnica Superior de Ingeniería Informática, Coordinadora del nuevo Máster Universitario en Humanidades Digitales de la UNED

Resumen de la intervención

Este Compartir Pantalla está dedicado a la herramienta Transkribus (https://readcoop.eu/transkribus/) que permite transcribir documentos históricos utilizando modelos entrenados por diferentes investigadores. Aunque es una aplicación basada en Inteligencia Artificial, su uso es sencillo para tareas de transcripción básicas. Esta herramienta es un ejemplo de cómo investigaciones en el marco de un proyecto europeo encuentran una vía de mantenimiento tras la finalización del proyecto, el problema más crítico de persistencia de aplicaciones en Humanidades Digitales y en la informática en general. Tras presentar la herramienta y uno de los 9 modelos públicos disponibles para español, el modelo desarrollado en el grupo de investigación de la ponente (https://readcoop.eu/model/spanish-print-xviii-xix/), se mostrará la práctica de alguna de las funcionalidades principales con el corpus digitalizado en la BNE del Diario de Madrid en el marco del proyecto CARA-NLP(https://clara-nlp.uned.es/). No se requiere que los asistentes posean conocimientos previos.
❌