martes
9 MarMódulo 9: Procesamiento de datos escalable
Comenzamos el noveno módulo de la V Edición del Máster big Data: Procesamiento de datos escalable.
El objetivo de este módulo es dar a conocer el sistema de procesamiento de datos escalable Apache Spark así como realizar una introducción a Apache Hadoop y su sistema de almacenamiento distribuido HDFS . Se ofrecerá una visión global de las características de Spark y se trabajará con las dos APIs que ofrece en la actualidad, una basada en RDDs (Resilient Distributed Datasets) y otra basada en dataframes.
Tecnologías: Spark, Java, Python, Intellij Idea, PyCharm.
Docentes
Cristóbal Barba González
Investigador, UMA
Experto en aplicación de la semántica al análisis del Big Data y en el desarrollo de matauristicas multiobjetivo. Imparte el módulo de procesamiento de datos escalable: matching learning y streaming.
Antonio Jesús Nebro Urbaneja
Catedrático de Universidad, UMA
Experto en aplicación de técnicas de optimización y paralelismo en el contexto de aplicaciones del Big Data. Imparte los módulos de procesamiento de datos escalable: Spark, machine learning y streaming.
Deja un comentario