En primer lugar debemos distanciarnos en este blog de la problemática de migración de bases de datos o aplicaciones informáticas en general, que conlleva otros retos y connotaciones de carácter técnico. Aquí hablaremos únicamente de migrar documentos o agrupaciones documentales.
En este contexto diferenciaremos entre 2 situaciones distintas de creciente dificultad:
- Migración de imágenes con sus índices o metadatos asociados;
- Migración de documentos gestionados en un gestor documental a sustituir.
En el primer caso, partimos de repositorios de imágenes en discos duros, CDs, DVDs, etc. y hojas de cálculo, archivos de texto o incluso tablas de bases de datos donde residen los índices y/o metadatos asociados con las imágenes
En el segundo caso nos encontramos con un aplicativo, normalmente obsoleto y carente de soporte técnico por parte del proveedor original, que posee algún mecanismo de almacenamiento de imágenes, metadatos y flujos de trabajo.
Lograr en esta situación una funcionalidad equivalente o superior al antiguo sistema de gestión documental constituye un reto, dado que muchas veces no se dispone de toda la información necesaria para realizar una migración adecuada.
Objetivos de la migración:
Antes de iniciar el proyecto de migración, es importante definir bien el alcance del mismo, pues esto determinará el modo de abordarlo.
Por un lado hay que definir qué se requiere migrar, distinguiendo entre:
- Sólo imágenes
- Imágenes y metadatos
- Imágenes, metadatos y workflow.
Por otro lado, hay que cuantificar el número de elementos a migrar, considerando la suma de unidades documentales mínimas a migrar, esto son páginas (cuando no se dispone del archivo PDF que representa al documento), documentos o expedientes (cuando se han escaneado juntos varios tipos documentales).
Errores comunes heredados:
En el proceso de digitalización e indexación nos encontramos frecuentemente con situaciones de base que tienen muy difícil solución. Estos errores suponen una pérdida lamentable de tiempo y dinero para el cliente y, en ocasiones, implican una pérdida irremisible de información y contexto.
Nos referimos en concreto a los siguientes casos:
- Digitalización con indexación incompleta o inadecuada. A veces por no haber realizado un análisis previo, no se han recogido ciertos datos que posteriormente serán vitales para encontrar los documentos. Ejemplos típicos de omisiones son números de identificación de personas, dependencias productoras, remitentes, fechas, valores u otros datos relevantes del proceso. Automatizar la clasificación de estos documentos se convierte en tarea muy ardua.
- Digitalización en formatos obsoletos o sin la calidad suficiente. Cuando se escanea por debajo de cierta resolución, se hace imposible procesar automáticamente las imágenes con un software OCR/ICR. Por ello, se pierde la posibilidad de hallar cadenas de texto dentro del documento. Por otro lado, hay formatos propietarios u obsoletos que son más complicados para distribuir o visualizar en cualquier sistema o dispositivo que los más habituales como PDF, JPEG o TIFF.
- Granularidad inadecuada. Consiste en digitalizar páginas de documentos en lugar del propio documento como tal, o bien digitalizar el expediente completo con todos sus tipos documentales sin separarlos. En el primer caso se aumenta la complejidad innecesariamente, dado que los usuarios no están interesados en consultar documentos página a página, sino en ver el documento completo. En el segundo, no es posible realizar una gestión documental apropiada, al no disponer de las unidades documentales aisladas.
Si tenemos en cuenta la antigüedad y la cantidad de los registros históricos entenderemos que un pequeño error en el proceso puede provocar, cuanto menos, una enorme pérdida de tiempo y esfuerzo de recuperación.
Retos de la migración:
Frente a los objetivos descritos y los errores heredados, nos enfrentamos a una serie de retos que conviene recapitular…
Los históricos no gestionados en un software anterior (estáticos) suelen estar disponibles en repositorios electrónicos de formatos planos de imagen, texto y/o hojas de cálculo, por lo que el acceso a la información es normalmente sencilla.
En esta categoría los retos son:
- Número elevado y heterogéneo de registros. Dificulta el proceso de carga de información, aumentan el tiempo del proceso y pueden provocar una ralentización de la base de datos de destino.
- Información de clasificación deficiente, lo que dificulta la clasificación y posterior consulta de los registros.
- Pre-proceso necesario, por ejemplo transformación a formatos longevos (PDF/A), fusión de imágenes en un solo documento, división de unidades documentales complejas en simples, extracción de texto con OCR, etc.
En el caso de la migración de históricos gestionados en un software anterior, los principales problemas son:
- Acceso a los datos e imágenes para realizar la carga de forma automatizada;
- Mantener la funcionalidad anterior, tratando de aumentarla con el nuevo software;
- Resistencia al cambio por parte de los usuarios más frecuentes del aplicativo anterior.
Condiciones de contorno:
- Tiempo disponible limitado;
- Fecha del apagado definitivo del aplicativo anterior (punto cero);
- Capacidad de búsqueda y extracción de información;
- Preservación de la funcionalidad (workflow);
- Resistencia al cambio de los usuarios;
- Fusión del repositorio futuro e histórico.
Recordemos que la migración es muchas veces minusvalorada en su importancia, lo que puede poner en riesgo el proyecto integral de implantación del sistema de gestión documental.
Fases en la migración:
Tras las explicaciones anteriores, estamos en condiciones de recomendar una metodología para llevar a cabo con éxito la migración de los históricos documentales.
Las fases sugeridas son:
- Análisis de las fuentes y formatos
- Preparación de datos (pre-procesamiento)
- Configuración de la estructura documental en el software
- Piloto de migración
- Validación del piloto
- Migración masiva
- Validación del proceso
- Puesta en marcha
Capacidades de migración de ABOX:
En esta ocasión hablaremos de la plataforma ABOX porque nos ofrece una serie de prestaciones tecnológicas y funcionales que permiten abordar los procesos de migración con amplias perspectivas de éxito.
Las principales ventajas de este software son la separación lógica entre estructura del fondo documental y contenidos de dicho fondo, unido a su capacidad de automatización y supervisión de las cargas de contenidos.
Las entidades involucradas en la migración se importan al sistema de forma previa a la migración:
- Organizaciones/ dependencias
- Listas maestras;
- Metadatos según tipo de unidad documental;
- Esquemas de metadatos por tipo de unidad documental;
- Bandejas para repositorios, algunas de ellas automatizadas por criterios de tiempo o de tipología documental;
- Carga de varias versiones del Cuadro de Clasificación Documental (CCD) ó de las Tablas de Retención Documental (TRD).
A continuación se aplican importadores masivos, que se programan por tiempos y trabajan de forma desatendida, con los logs correspondientes.
ABOX puede trabajar con servidores de migración concurrentes con el servidor de aplicaciones, para acelerar los tiempos del proceso y/o permitir la convivencia entre el uso productivo del software y la migración de los contenidos.
Por último, ABOX nos brinda la posibilidad de crear tablas especiales para migraciones masivas, que no requieran workflow, por ejemplo, para consultas de millones de imágenes históricas, sin menoscabo en la velocidad de procesamiento del archivo actual.