Procesamiento de Consultas en Bases de Datos Paralelas

Procesamiento de Consultas en Bases de Datos Paralelas

José Guadalupe Ruíz Carrete
 

Texto completo de la Tesis     

 


Resumen

En años recientes se ha producido un incremento continuo en la cantidad de datos manipulados por los sistemas manejadores de bases de datos (DBMS). Más aún, ya no resulta extraño para un DBMS manipular bases de datos con tamaños que van desde los cientos de gigabytes hasta terabytes. Por otra parte, los sistemas con múltiples procesadores son cada vez más accesibles, por lo que es posible aplicar cómputo paralelo para procesar grandes volúmenes de información en las bases de datos. El procesamiento de juntas (joins) en bases de datos, es una operación que demanda muchos recursos de cómputo, sobre todo en bases de datos grandes. Para resolver este problema se hace necesario combinar técnicas de bases de datos -especialmente bases de datos distribuidase y procesamiento paralelo para reducir los tiempos de respuesta a los usuarios de una base de datos grande. En el presente trabajo, se muestran algoritmos para realizar cada una de las etapas involucradas en la implementación de una base de datos en paralelo. Los algoritmos son desarrollados en C haciendo uso de la interfaz de paso de mensajes (MPI).