Universidad Veracruzana

Skip to main content

CA-003

Título:
Reducción del Tiempo de Ejecución del Proceso de Extracción, Transformación y Carga usando Bases de Datos Intermedias para Proyectos con Grandes Volúmenes de Datos

Resumen:
La creciente cantidad de datos generada por las Tecnologías de Información y Comunicación, al día de hoy permite transformar la manera en que se toman las decisiones, pues hoy la sociedad se basa en la información que esos datos puedan brindar. Esta situación trae beneficios significativos, sin embargo, cabe destacar, que esa facilidad que nos brinda abre también una serie de desafíos para el área computacional esto es, en base al tratamiento de la enorme cantidad de datos como puede ser el trabajo de procesamiento y analítica. En el área de analítica de datos se necesita hacer una visión general y, al mismo tiempo minuciosa de los datos ya que se integrarán en un data warehouse (almacén de datos), para ello se implementan procesos de Extracción, Transformación y Carga de datos (ETL). Sin embargo, para integrar los datos en el data warehouse se necesita de herramientas o estrategias que brinden la facilidad de desarrollar el ETL en el menor tiempo posible. Por lo antes mencionado, este trabajo de investigación presenta una estrategia para la integración de datos en donde se incluyen bases de datos intermedias con la finalidad de disminuir el tiempo en que éste proceso se lleve a cabo. Además, en este trabajo se realiza la comparación entre esta estrategia y el proceso ETL tradicional en el que no intervienen bases de datos intermedias. En base a los resultados de esta investigación se puede concluir que incorporar bases de datos intermedias reducen el tiempo en realizar el proceso ETL comparándolo con el proceso tradicional. Además, el presente trabajo contribuye con una guía para realizar estos procesos ETL, pues al investigar se observó que no hay una guía completa sobre éstos.

Autor del Trabajo:
Ing. Ceila Yasmín García Morales

Director del Trabajo:
Dr. Alfredo Cristóbal Salas

Participantes:
Dr. Raúl Alejandro Luna Sánchez
Dra. Carolina Solís Maldonado

Contribuciones:
Este trabajo recepcional brinda una estrategia para cargar grandes volúmenes de datos a un almacén de datos. El resultado de este trabajo también puede ser aplicado a situaciones donde se tiene la necesidad de migrar grandes volúmenes de datos y, además, se contribuye con un manual para la creación de proyectos Pentaho, específicamente trabajando con jobs y transformaciones, así como la creación de usuarios en un gestor de base de datos.

Palabras clave:
Datos, etl, proceso, tiempo, bases de datos, analítica, cantidad.

Fecha:
07/2019.

Editor:
Facultad de Ingeniería en Electrónica y Comunicaciones de la Universidad Veracruzana Región Poza Rica – Tuxpan.

Colección:
Cómputo Avanzado.

Enlaces de pie de página

Ubicación

Redes sociales

Transparencia

Código de ética

Última actualización

Fecha: 27 mayo, 2024 Responsable: Dr. Alfredo Cristóbal Salas Contacto: acristobal@uv.mx