Extracción, fase clave en los procesos ETL

ETL Proccess

 

 

En los procesos de traspaso de datos entre diferentes sistemas, el motivo esencial que mueve a las empresas a realizar esta operación es su resultado. Pero la finalidad de los procesos ETL no siempre tiene que ver estrictamente con un entorno de modificación o construcción de un Data Warehouse, también abarcan otros múltiples propósitos. Hablamos de consolidar, migrar y sincronizar bases de datos ya operativas, migración por actualizaciones o nuevas versiones, sincronización con entornos ERP o programas de ventas, consolidación de datos para la actualización o borrado de los originales, integración con sistemas de envío de información externos de clientes o proveedores, combinación con sistemas FrontOffice o incluso preparación de procesos masivos que regulen las campañas de mailings o newsletter.

Queda claro, pues, que la esencia de los procesos ETL es su finalidad y el uso que se dará a esa información posteriormente.  Es por ello que puede ocurrir que el proceso inicial de extracción no se tome con la delicadeza y atención requerida. Pensar en las nuevas aplicaciones que daremos a la información volcada y los beneficios que nos reportará sin pensar en la forma de extraerla podría ser un grave error.

A grandes rasgos, todo proceso ETL consta de 3 fases: Extracción (extract), Transformación (transform) y Carga (load). Su finalidad última es traspasar datos de un sistema a otro, modificándolos en su proceso para que sean tratados correctamente tras alojarse en su nuevo destino.

Como adelantábamos en los párrafos anteriores, la fase de extracción de los procesos ETL puede resultar vital para el éxito global de la operación, no solo para la codificación de los datos en cuestión sino también en cuanto al impacto que una mala implementación de la extracción podría causar en el sistema de origen.

En el peor de los casos, la fuente desde la que extraer los datos podría verse afectada de forma permanente a causa de una mala planificación. Con ello, dicho sistema no podría volver a utilizarse correctamente para su uso habitual si la extracción llegara a provocar un colapso en este.

“Para evitar riesgos, el proceso de extracción habitualmente se programa para que la operación se lleve a cabo en días u horarios donde la interferencia con el uso del sistema sea baja o, a poder ser, inexistente.”

Por todo lo expuesto, es esencial tomar todas las medidas de seguridad y cautela necesarias para que este proceso no influya en el rendimiento de los sistemas ni en los propios datos procesados, convirtiéndose de este modo en una fase clave de todo proceso ETL.

Deja un comentario