martes, 15 de marzo de 2016

Conversión automática de artículos de formato Word a archivos XML

Para contribuir a la optimización de la producción editorial digital, eScire y la librería científica en línea SciELO han trabajado de manera conjunta para el desarrollo de “Convert2MLX”, un software libre que realiza la conversión automática de artículos de formato Word a archivos XML, mediante un sistema integrado al flujo de trabajo en Open Journal Systems (OJS).

“Es un programa que ha emprendido SciELO para modernizar sus líneas de trabajo y de producción basado en XML. Es momento de tomar decisiones y las revistas tienen que elegir el mundo electrónico, porque es el mundo útil, donde más se difunde la información actualizada”, comentó el Doctor Antonio Sánchez Pereyra, Jefe del Departamento de Bibliografía Latinoamericana de la Dirección General de Bibliotecas, UNAM, y responsable del desarrollo de la colección SciELO México.

A través de un webinar, Joel Torres, presidente de la consultora eScire, puntualizó el objetivo primario de esta herramienta: “se trata de obtener los archivos en XML dentro del mismo portal OJS de la revista, como sucede para el procesamiento de documentos que realiza SciELO, el cual consiste en la aplicación de metadatos según el estándar JATS (Journal Article Tag Suite). Así, se pueden generar indicadores bibliométricos basados en la citación, además de la visualización del texto para el lector”.

El XML y sus ventajas

El formato XML (Xtensible Markup Language) sirve para almacenar datos organizados de tal manera que puedan ser leídos igual por personas o por computadoras y ofrece múltiples ventajas en comparación con formatos de salida como PDF o de InDesign, como:


  • Generar elementos semánticos para identificar los elementos bibliográficos, como citas, autores, referencias, etc., de modo que se puede monitorear quién, cómo y cuántas veces ha citado dicho artículo; lo cual también contribuye a que sea más accesible y visible para los motores de búsqueda.
  • Preservar el contenido a largo plazo, ya que se trata de un formato abierto.
  • Intercambiar datos que todos puedan leer, en cualquier dispositivo y sistema.

“Hasta ahora la publicación se basa en html. Ha sido funcional, pero desde la perspectiva del usuario es bastante plano, austero, sin diseño; en cambio el XML es un documento con más estética, más dinámico y más interactivo para el lector, con la clara intención y la capacidad de ser leído en los dispositivos móviles, que es una tendencia creciente y actual”, señaló Sánchez Pereyra.

Trabajar con software libre bajo licencia GNU GLP, como el de OJS, permite que éste se descargue, ajuste y comparta. De acuerdo con Sánchez Pereyra, este tipo de trabajo colaborativo lleva más tiempo, sin embargo, ofrece otras ventajas: “el avance es lento pero se nutre más, es una mejora colectiva, un trabajo comunitario”, comentó.

La documentación y código del desarrollo del móduloestá disponible en: https://github.com/escire/Convert2XML/wiki

--
Fuente: http://blog.conricyt.mx/convert2xml-el-paso-de-word-a-xml-en-las-publicaciones-digitales/

0 comentarios:

Publicar un comentario