阅读视图

Compartir Pantalla con Pablo Ruiz Fabo. 18 de noviembre de 2025

Compartir Pantalla

Be API: Usar LLMs pasando de la interfaz

18 DE NOVIEMBRE DE 2025 – 19:00 (GMT+1)

Pablo Ruiz Fabo

Université de Strasbourg

Pablo Ruiz Fabo es profesor (Maître de conférences) en el Departamento de tecnologías lingüísticas y humanidades digitales de la Universidad de Estrasburgo desde 2018. Su investigación se basa en aplicaciones del procesamiento del lenguaje natural (PLN) a las humanidades digitales.

Ha trabajado sobre aplicaciones de PLN al análisis literario (poesía y teatro) y a la automatización de la creación de corpus digitales. Actualmente realiza un proyecto de estudios literarios computacionales en el CiTIUS – Universidad de Santiago de Compostela apoyado por el programa Marie Skłodowska-Curie.

Resumen de la intervención

Se presenta cómo usar las API de plataformas de LLM populares (OpenAI y otras), con ejemplos sencillos de código en Google Colab. También se presenta el uso de modelos locales (que no están alojados en una plataforma). La utilidad de esto es automatizar el trabajo: Las consultas a los LLMs se hacen automáticamente para un número arbitrario de casos, y las respuestas se pueden tratar en masa automáticamente. Se ofrecerán ejemplos prácticos sobre cómo aplicarlos a corpus en humanidades digitales, especialmente en ámbitos de comunicación y medios, asi como clasificación de poemas.

La entrada Compartir Pantalla con Pablo Ruiz Fabo. 18 de noviembre de 2025 se publicó primero en HDH - Humanidades Digitales Hispánicas.

  •  

Seminario Internacional Humanidades Digitales y Literatura del Siglo de Oro

La Universidad de León acogerá los días 29 y 30 de mayo de 2025 el Seminario Internacional «Humanidades Digitales y Literatura del Siglo de Oro», una cita académica que explorará las intersecciones entre las tecnologías digitales, la inteligencia artificial y el estudio de la literatura áurea. Este evento ha sido beneficiario de una de las ayudas HDH 2025 para la celebración de actividades científico-académicas.

El seminario, dirigido por María Luisa Alvite Díez y Sergio Rodríguez Nicolás, está organizado por el Departamento de Filología Hispánica y Clásica y el Instituto de Investigación de Humanismo y Tradición Clásica de la Universidad de León, en colaboración con la Sociedad Internacional de Humanidades Digitales Hispánicas (HDH) y el Vicerrectorado de Inclusión, Igualdad y Proyección Social de la ULE.

El programa incluye conferencias de especialistas como Sònia Boadas Cabarrocas, Álvaro Cuéllar González, Antonio Rojas Castro, David Merino Recalde, Sergio Rodríguez Nicolás, Carlota Fernández Travieso, Emanuele Leboffe y Laura Hernández Lorenzo, abordando temas como la estilometría, la edición digital, el análisis de redes, el modelado de datos y la transcripción automática de textos del Siglo de Oro.

La matrícula ya está abierta y ofrece tarifas reducidas para socios de la HDH. Toda la información y el formulario de inscripción están disponibles en la web de la Universidad de León:

https://extensionuniversitaria.unileon.es/cursos-y-matriculas/curso/2025con00006-seminario-internacional-humanidades-digitales-y-literatura-del-siglo-de-oro

La entrada Seminario Internacional Humanidades Digitales y Literatura del Siglo de Oro se publicó primero en HDH - Humanidades Digitales Hispánicas.

  •  

Café con Jesús Pedro Zamora Bonilla. 18 de marzo de 2025

Café con Jesús Pedro Zamora Bonilla

Los límites de los mundos virtuales

18 de marzo de 2025 – 19:00 (GMT+1)

Jesús Pedro Zamora Bonilla

Universidad Nacional de Educación a Distancia (UNED)

Resumen de la intervención

El objetivo de esta charla es señalar algunas limitaciones fundamentales de tres ideas habituales en el imaginario colectivo sobre los posibles efectos de la inteligencia artificial: en primer lugar, la tesis de la singularidad; en segundo lugar, el proyecto del megaverso; y en tercer lugar, la idea de que la propia realidad podría ser una simulación informática. Pese a los indudables avances de la IA, hay suficientes razones para pensar que su desarrollo futuro (al menos a medio plazo) estará muy lejos de realizar en toda su plenitud cualquiera de las tres ideas, o en ser siquiera verosímiles desde el punto de vista conceptual.

Biografía

Jesús Zamora Bonilla es catedrático de filosofía de la ciencia en la UNED. Ha trabajado principalmente en cuestiones relacionadas con la racionalidad científica, y sus artículos han sido publicados en algunas de las mejores revistas académicas de su área. También es autor de varios ensayos filosóficos (p.ej., Contra apocalípticos -Shackleton, 2021-, La nada nadea -Deusto, 2023-), algunas novelas, y es un constante divulgador de la filosofía en blogs y redes sociales.
  •  

Seminario: Inteligencia Artificial y patrimonio cultural

El próximo jueves 18 y viernes 19 de abril tendrá lugar en la Facultad de Filosofía y Letras de la Universidad Autónoma de Barcelona una de las actividades beneficiarias de las Ayudas HDH 2024 para la celebración de eventos científico-académicos (más información sobre las ayudas aquí).

Seminario: Inteligencia Artificial y patrimonio cultural

Jueves 18 y viernes 19 de abril
Sala de Graus, Facultat de Filosofia i Lletres

  • Organizado por PROLOPE, HEURESIS y LT&T
  • Con la colaboración de la Facultat de Filosofia y Lletres, el Departament de Filologia Espanyola y la Sociedad Internacional de Humanidades Digitales Hispánicas

Con este seminario queremos poner en común diferentes aproximaciones al estudio e investigación del patrimonio cultural, artístico y literario basadas en procesos de Inteligencia Artificial. Hablaremos de modelos de lenguaje, de ChatGPT y creación literaria, de estrategias de indexación probabilística, de clasificación de documentos y obras pictóricas, de datación automática, o de reconocimiento de texto e identificación de letra manuscrita.

El seminario estará abierto a cualquier interesado y se retransmitirá a través de Teams (https://bit.ly/IAPatrimonioCultural)
Id. de reunión: 315 885 488 502
Código de acceso: TRfgNt

  •  

Herramientas de webscraping como apoyo a la investigación

Desde hace dos décadas, el crecimiento exponencial de la información digital hace necesario el uso de técnicas y herramientas que permitan recuperar masivamente datos de la web. Las Humanidades Digitales también requieren en ciertos proyectos de estas aplicaciones, basadas en la minería de texto, para obtener información con la que llevar a cabo sus investigaciones.

El webscraping (o scraping, raspar) es una técnica usada para extraer contenido de sitios web, que permite construir datasets o conjuntos de datos desde la web. El procedimiento es sencillo, se captura la información en HTML enviada a nuestro navegador y se procesa, realizando operaciones de filtrado, conversión de formatos y etiquetado, para obtener datos estructurados que puedan ser almacenados y posteriormente analizados en estudios de investigación. De esta manera, los datos adquieren un carácter multivalente al pasar de una amplia dispersión en la web a formatos más sencillos para usos instrumentales. Así, por ejemplo, es posible extraer datos de estadísticas de organismos oficiales o de redes sociales para el estudio de fenómenos sociales o culturales.

Aplicaciones para la extracción de datos

Entre las aplicaciones más populares para la extracción de datos se encuentran:

  • Octoparse: permite extraer fácilmente casi todo tipo de datos en sitios web, ya que ofrece amplias funcionalidades y capacidades. Cuenta con dos modos de operación: Plantilla de tarea y Avanzado, para aprender rápidamente sin conocimientos de programación. La interfaz es muy intuitiva, ya que nos guía durante el proceso de extracción. Una vez extraído el contenido del sitio web, posibilita guardarlos en formatos estructurados como EXCEL, TXT, HTML o sus bases de datos en un corto período de tiempo.
  • Import.io: es una de las herramientas de webscraping por excelencia ya que extrae datos de casi cualquier sitio web. Es muy fiable y fácil de usar. Permite crear datasets o conjuntos de datos al importar hasta 1.000 páginas (URL’s) de contenidos a un CSV en una sola vez y cuenta con funcionalidades como el envío de alertas cada vez que se extrae algo.
  • ParseHub: esta aplicación gratuita facilita también la extracción de datos de cualquier página web sin necesidad de programar nada. Simplemente hay que seleccionar lo que debe extraer e indicar cómo clasificarlo. Para ello, previamente debemos descargar e instalar el programa en el ordenador.

Códigos de programación para diseñar todo el proceso

Por otro lado, se pueden utilizar códigos de programación o sistemas basados en lenguajes que permiten diseñar todo el proceso, ajustándose lo más posible al proyecto y las webs que se quieren procesar, que requieren conocimientos de programación para diseñar y poner a funcionar el proceso de extracción. Entre las herramientas más conocidas en este modelo están:

  1. Para Pyton: Scrapy, BeautifulSoup y Selenium
  2. Para R: Rcrawler y Rvest

Expresiones regulares

Por último, dentro de este apartado es importante señalar, sobre todo por su aplicación en las Humanidades Digitales, el concepto de Expresiones Regulares (regex) para la extracción de datos textuales. Las expresiones regulares son una serie de códigos que se utilizan para localizar patrones de texto. A través de una serie de operadores y códigos se puede recuperar segmentos específicos.

La entrada Herramientas de webscraping como apoyo a la investigación se publicó primero en LINHD.

  •  

El LINHD aboradará en un Curso de Verano la creación de un proyecto en humanidades digitales basado en el análisis de textos

Creación de un proyecto en Humanidades Digitales basado en el análisis de textos: modelado y procesamiento, dirigido por Víctor Fresno Fernández, profesor en el Departamento de Lenguajes y Sistemas Informáticos (LSI) de la UNED, y coordinado por Salvador Ros Muñoz, director del Laboratorio de Humanidades Digitales de la UNED (LINHD), es el título del curso que se desarrollará del 27 al 29 de junio dentro de la oferta de Cursos de Verano de la UNED programada para este año.

Objetivos del curso y programa

El objetivo del curso es diseñar un proyecto de humanidades digitales desde el modelado del dominio hasta la creación de resultados y su diseminación, haciendo uso de lenguajes de programación, técnicas de modelado y visualización provenientes del mundo de la inteligencia artificial.

Entre los contenidos que se ofrecen a lo largo de tres jornadas destacan:

  • una aproximación al mundo de las Humanidades Digitales
  • las problemáticas que surgen para el análisis de textos
  • un acercamiento a las metodologías y técnicas para resolver esos problemas mediante el modelado semántico y la perspectiva de los datos enlazados y lenguajes de marcas
  • una presentación de los nuevos paradigmas computacionales relacionados con la Inteligencia Artificial como el procesamiento de textos, la estilometría, el deep learning, etc., y su aplicación
  • representación de resultados
Duración y metodología

El curso tendrá una duración de veinte horas y será eminentemente práctico para los alumnos, estimulando además el uso de sus propios materiales, sobre los que se realizarán los ejercicios. Se utilizarán herramientas como notebooks y será impartido basándose en el lenguaje Python y sus librerías para su aplicación a los problemas propios de la investigación en Humanidades Digitales.

El estudiante, que podrá elegir participar presencialmente (en el Salón de Grados de la Facultad de Educación) o en línea (en directo o en diferido), presentará en un trabajo final un potencial proyecto de su interés al cual se le pueda aplicar lo expuesto durante el curso.

Perfil del estudiante

El perfil al que va dirigido el curso es multidisciplinar: especialistas en Humanidades Digitales, lingüistas, investigadores, profesores, académicos y estudiantes tanto de máster como de doctorado, preferentemente en disciplinas humanísticas, pero también en disciplinas como informática o ciencias de la información. Está abierto, en definitiva, a todos aquellos interesados en conocer métodos digitales de investigación aplicados a las humanidades.

Matricula abierta e información del curso

Foto de Bram Naus en Unsplash

La entrada El LINHD aboradará en un Curso de Verano la creación de un proyecto en humanidades digitales basado en el análisis de textos se publicó primero en LINHD.

  •  

Compartir Pantalla con Ana García Serrano. 4 de julio de 2023

Compartir Pantalla: Transkribus

4 DE JULIO DE 2023 – 19:00 (GMT+2)

Ana García Serrano

Profesora Titular de la Universidad Nacional de Educación a Distancia en la Escuela Técnica Superior de Ingeniería Informática, Coordinadora del nuevo Máster Universitario en Humanidades Digitales de la UNED

Resumen de la intervención

Este Compartir Pantalla está dedicado a la herramienta Transkribus (https://readcoop.eu/transkribus/) que permite transcribir documentos históricos utilizando modelos entrenados por diferentes investigadores. Aunque es una aplicación basada en Inteligencia Artificial, su uso es sencillo para tareas de transcripción básicas. Esta herramienta es un ejemplo de cómo investigaciones en el marco de un proyecto europeo encuentran una vía de mantenimiento tras la finalización del proyecto, el problema más crítico de persistencia de aplicaciones en Humanidades Digitales y en la informática en general. Tras presentar la herramienta y uno de los 9 modelos públicos disponibles para español, el modelo desarrollado en el grupo de investigación de la ponente (https://readcoop.eu/model/spanish-print-xviii-xix/), se mostrará la práctica de alguna de las funcionalidades principales con el corpus digitalizado en la BNE del Diario de Madrid en el marco del proyecto CARA-NLP(https://clara-nlp.uned.es/). No se requiere que los asistentes posean conocimientos previos.
  •