Módulo 3: Bases de datos NoSQL

Módulo 3: Bases de datos NoSQL

El objetivo de este módulo es introducir las bases de datos NoSQL y adquirir competencias en el uso de Apache Cassandra y MongoDB.

  1. En el caso de Cassandra, se pretende que el alumno comprenda cómo el diseño de la base de datos es la pieza central para obtener un alto rendimiento en un modelo de datos orientado a columnas.
  2. En el caso de MongoDB el alumno deberá aprovechar la flexibilidad de este sistema gestor de bases de datos para ofrecer un sistema de almacenamiento eficiente, incluyendo el análisis de las posibilidades de replicación y distribución de los datos.

Tecnologías: Apache Cassandra, MongoDB, Mongo Compass, Anaconda (Python)

Este módulo será impartido por María del Mar Roldán e Ismael Navas Delgado

Docentes
Apache Cassandra - Wikipedia, la enciclopedia libre

María del Mar Roldán García es Co-directora académica de este Máster en Big Data y Profesora Contratado Doctor de la UMA ( mmar@lcc.uma.es). Es experta en bases de datos y aplicaciones semánticas, razonamiento escalable y aplicación de la semántica en algoritmos de análisis del Big Data. Imparte el módulo de bases de datos relacionales y el módulo de bases de datos NoSQL, concretamente Cassandra

Mongo

Por su lado, Ismael Navas Delgado es Profesor Titular de Universidad en la UMA y experto en integración de datos, Web Semántica y Linked Data y análisis del Big Data aplicado a problemas en ciencia. Imparte el módulo de bases de datos NoSQL, concretamente MongoDB.

Apache Cassandra

Apache Cassandra es un software NoSQL distribuido y basado en un modelo de almacenamiento de «clave-valor», de código abierto y escrito en Java. Permite grandes volúmenes de datos en forma distribuida.

Por ejemplo, lo utiliza Twitter en su plataforma. Su objetivo principal es la escalabilidad lineal y la disponibilidad. La arquitectura de Cassandra está basada en una serie de nodos iguales que se comunican con un protocolo P2P con lo que la redundancia es máxima. Soportada por la Apache Software Fundation.

Como hemos comentado, Cassandra ofrece un gran rendimiento. Investigadores de la Universidad de Toronto que estudian sistemas NoSQL concluyeron que “En términos de escalabilidad, hay un claro ganador. Cassandra logra el más alto rendimiento para el número máximo de nodos en todos los experimentos”.

MongoDB

MongoDB por su lado, es una BD NoSQL orientada a documentos. Esto quiere decir que en lugar de guardar los datos en registros, guarda los datos en documentos. Estos documentos son almacenados en BSON, que es una representación binaria de JSON.

Una de las diferencias más importantes con respecto a las bases de datos relacionales, es que no es necesario seguir un esquema. Los documentos de una misma colección ( lo que llamamos tabla en una BD relacional), pueden tener esquemas diferentes.

Esto que es algo impensable en una base de datos relacional, es algo totalmente válido en MongoDB.

Related Posts

Deja un comentario

Your email address will not be published. Required fields are marked.*

× ¿Cómo puedo ayudarte?