SOFTWARES PARA TRANSCRIPCIÓN DE MANUSCRITOS

A continuación presentamos algunos programas diseñados para la transcripción de manuscritos. Además del primero (Transcript), los otros son más complejos (demandan de una instalación en la base de datos, aunque son compatibles con Omeka) y que se caracterizan por ser colaborativos, es decir, que permiten que un documento o un corpus pueda ser transcrito, corregido, comentado por un grupo definido de personas. El entorno colaborativo parte de un acceso común mediante la disponibilidad en línea a través de un portal. Muchos de estas iniciativas, propias de las Humanidades Digitales, son utilizadas por proyectos e instituciones de gran renombre internacional, como se menciona en los respectivos entornos virtuales.

Transcript

Es un programa "diseñado para ayudarte a transcribir el texto de imágenes digitales de documentos", elaborado por Jacob Boerema. Se puede descargar de la siguiente dirección: http://www.jacobboerema.nl/en/Freeware.htm#Downloads. Es gratuito siempre y cuando su uso sea personal. Para empresas, se pide pagar 15 euros por usuario a utilizar, lo cual ofrece una versión pro con muchas más herramientas.

Hemos probado la versión gratuita, cuya instalación es sencilla. La interfaz, disponible en español, consiste, principalmente, en dos secciones: una para la imagen del manuscrito a transcribir y la otra un cajón para la transcripción. Por tanto, se puede visualizar simultáneamente la imagen que se está transcribiendo sin tener que alternar de ventana (imagen y procesado de texto) constantemente. Esta es la principal ventaja de este programa, pero que a su vez es muy limitado. Si lo comparamos con Word, nos ofrece incluso menos opciones de edición de textos. Vale la pena en el sentido de emplear, digamos, un programa profesional para la labor de transcripción.

Captura de imagen del espacio de trabajo del programa instalado en nuestro ordenador. La imagen es una fotografía tomada de un documento existente en el Archivo Regional de Cusco. Fecha de captura: 24 de agosto de 2015. Derechos: Proyecto CEDOSA
Sobre la imagen se rescata la opción de hacer zoom (acercar como alejar), cambiar de imagen que están almacenadas en una misma carpeta. Otras opciones de utilidad son: luminosidad, negativo, escala de grises, girar, etc. 

En cuanto al espacio correspondiente a la transcripción, se trata de un espacio blanco sinfín, sin la separación por páginas como en World. Para poder realizar una transcripción con una mayor rapidez, demanda conocer y acostumbrase a los nuevos comandados. Por ejemplo, para subrayar, no funciona Control + S como en Word, sino Control + U (del Underline inglés). El superíndice (que en World se puede lograr resaltando con control +), ahora se debe dar un botón y lo que ello supone, quitar el puntero de la transcripción. Aún no hemos encontrado la opción para ingresar otros caracteres, pero es posible pegarlos (Control + V) tras haberlos copiado en World.  

Como señala la página web, las herramientas de edición no incluidas son: notas a pie de página o al final, encabezados, información de indización, marcas ni hiperenlaces, estilos, columnas.

Al dar clic en la transcripción, la imagen superior se desplaza (el número de los píxeles que se desplazan pueden ser ajustados en las opciones), con el intento de corresponder entre lo que toca transcribir y lo que se visualiza. 

Captura de imagen de las barras de comando del programa Transcript. Fecha de captura: 24 de agosto de 2015. Derechos: Proyecto CEDOSA
Se pueden configurar otros aspectos en la caja de opciones, agrupadas en generales, imagen, avanzadas e idioma. 

Captura de imagen de las opciones del programa Transcript. Fecha de captura: 24 de agosto de 2015. Derechos: Proyecto CEDOSA

Fromthepage (aún no probado)

Para instalación en base de datos del servidor de una página web http://fromthepage.com/static/about#fromthepage2
Una nueva versión en estado beta se encuentra disponible.

Captura de imagen de la página web http://beta.fromthepage.com/. Fecha de captura: 24 de agosto de 2015. Derechos: Proyecto CEDOSA
La descripción del programa según la página web es la siguiente:
FromThePage is free software that allows volunteers to transcribe handwritten documents online. It’s easy to index and annotate subjects within a text using a simple, wiki-like mark-up. Users can discuss difficult writing or obscure words within a page to refine their transcription. The resulting text is hosted on the web, making documents easy to read and search.
Las características arriba mencionadas son completadas en la relación siguiente (extraído de http://fromthepage.com/static/about#fromthepage2):
  • Transcripción colaborativa.
  • Indización, para etiquetar personas, lugares y otros temas. La indización permite mejores búsquedas del documento.
  • Discusión.
  • Seguridad.
  • Control de versiones.
  • Corrección del OCR (Reconocimiento óptico de caracteres).
  • Gestión de proyectos.
  • Escrito de editor
  • Exportar a TEI-XML 
  • Integración con Omeka y Archive.org
Desde la página web se puede, mediante un simple registro, participar ya sea transcribiendo documentos pertenecientes a proyectos ya existentes ("Start Transcribing") o presentando a los encargados un proyecto propio, el cual pueda ser colocado en la web ("Start Your Project"). De la misma manera, se puede instalar de forma independiente en una página web ("Run Your Server").

Scripto (aún no probado)

Dirección: http://scripto.org/

Captura de imagen de la página web http://scripto.org/. Fecha de captura: 24 de agosto de 2015. Derechos: Proyecto CEDOSA
Programa libre y de código abierto, diseñado para la colaboración de varios usuarios en el proceso de transcripción. Trabaja con MediaWiki. Actualmente se puede instalar en Omeka, ya no se encuentra disponible lamentablemente, en Word Press ni Drupal.

Otros enlaces de interés

  • Transcription tools. Lista se softwares para la transcripción de no solo documentos, también de archivos de audios. Disponible en: http://digitalresearchtools.pbworks.com/w/page/17801711/Transcription%20Tools.
  • Blog Collaborative Manuscript Transcription. Disponible en: http://manuscripttranscription.blogspot.de/.
  • Forum "collaborative software for transcribing a digital images of handwritten documents". Disponible en: http://digitalhumanities.org/answers/topic/collaborative-software-for-transcribing-digital-images-of-handwritten-documents.
Entrada n° 111.

2 comentarios:

  1. Pues ha faltado Textual Communities (https://textualcommunities.org/app). No sólo se puede transcribir, si no también cotejar, y producir ediciones.

    ResponderEliminar
    Respuestas
    1. Buenísima recomendación, que, sin duda, incluiremos. Saludos.

      Eliminar

Con la tecnología de Blogger.