BASES DE DATOS DISTRIBUIDAS

BASES DE DATOS DISTRIBUIDAS



     Una Base de Datos Distribuida (BDD) es una colección de datos distribuidos en diferentes nodos de una red de computadoras. Cada sitio de la red es autónomo, puede ejecutar aplicaciones locales y al menos una aplicación global, lo cual requiere el acceso a datos, ubicados en varios sitios, usando un subsistema de comunicación. Los Sistemas de Bases de Datos Distribuidas representan más naturalmente la estructura geográficamente descentralizada de una organización, aumentan la disponibilidad de los datos, reducen el tráfico de comunicación y es justificable, además, por el abaratamiento de los costos en el equipamiento y la infraestructura de comunicaciones de las redes de computadoras. El diseño de las Bases de Datos Distribuidas posee las fases del diseño centralizado y cuenta, además, con dos nuevos problemas que caracterizan el proceso de distribución de datos, e incluyen la determinación de: cómo dividir la base de datos en componentes para localizarlos en diferentes sitios, qué cantidad de datos debe ser replicados y cómo deben los fragmentos replicados ser localizados.




CARACTERÍSTICAS DE LAS BASES DE DATOS DISTRIBUIDAS
·         Los datos deben estar físicamente en más de un ordenador (distintas sedes)
·         Las sedes deben estar interconectadas mediante una red (cada sede es un nodo de la red)
·         Los datos han de estar lógicamente integrados (recuperación y actualización) tanto en local como remoto (esquema lógico global y único).
·         En una única operación se puede acceder (recuperar o actualizar) datos que se encuentran en más de una sede (acceso a datos locales o remotos).
·         Todas las acciones que necesiten realizarse sobre más de una sede serán transparentes al usuario (transparencia de distribución para el usuario).
 

Ventajas
·    El acceso a los datos es más rápido debido a que los datos se localizan más cercanos al lugar donde se utilizan.
·     El procesamiento es rápido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo,
·         Nuevos nodos se pueden agregar fácil y rápidamente.
·       La probabilidad de que una falla en un solo nodo afecte al sistema es baja y existe una autonomía e independencia entre los nodos.
·        Control local de los datos con que se interactúa.
·         Mayor tolerancia a los fallos



Desventajas
 
·                     Es más complicado el control y la manipulación de los datos
·                     Es compleja el aseguramiento de la integridad de la información en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la información.
·                     El control de concurrencia y los mecanismos de recuperación son mucho más complejos que en un sistema centralizado dado que los datos pueden estar replicados.
 
CASOS DE ESTUDIO 
    En los casos de estudio se tiene: LightCloud, que es una base de datos distribuida basada en clave-valor, esto significa que los datos que maneja la base de datos se obtienen a partir de una clave única. Esta ofrece un gran rendimiento ya que tiene la facultad de almacenar millones de claves en muy pocos servidores, además ofrece fácil escalabilidad, es tolerante a fallos y agiliza todos sus procesos a través del balanceo de carga, genera copias de seguridad y restauración en caliente, esta programada bajo Python y es extensible a cualquier otro lenguaje.







No hay comentarios:

Publicar un comentario