Apache Spark: Introducción, qué es y cómo funciona
Apache Spark es un framework de programación para procesamiento de datos distribuidos diseñado para ser rápido y de propósito general…
Leer másApache Spark es un framework de programación para procesamiento de datos distribuidos diseñado para ser rápido y de propósito general…
Leer másComenzamos semana y comenzamos nuevo módulo. Estamos a mediados de marzo y lanzamos un m´ódulo apasionante, procesamiento de datos escalable, de la mano de Antonio Jesús Nebro.
Leer másEntender qué es Spark y cuál es su impacto para el Big Data es el primer paso para que las empresas puedan llevar sus capacidades de gestión de datos al siguiente nivel…
Leer másExisten varios modos de instalar Apache Spark: Modo Standalone : Tenemos el HDFS (Hadoop Distributed File System), es decir, el sistema de archivos distribuido de Haddop, y por encima estaría Apache Spark. Hadoop V1 (SIMR) : Tenemos el HDFS y por encima Map Reduce, y por encima del mismo estaría Apache Spark. Hadoop V2 (YARN) : Tenemos nuestro HDFS
Leer másApache Spark nació en 2009 en la Universidad de Berkeley, y actualmente se encuentra en la versión 2.3.0.
Leer másEste módulo tiene lugar entre el 17 y el 27 de febrero y será impartido por Cristobal Barba González y Antonio Jesús Nebro Urbaneja. El objetivo de este módulo es dar a conocer el sistema de procesamiento de datos escalable Apache Spark. Se ofrecerá una visión global de las características de Spark y se trabajará
Leer más