lunes
18 EneMódulo 5: Use Case 1
Comenzamos con el módulo 5, primer caso de uso. El objetivo principal de este módulo es tener una primera experiencia en el manejo de datos integral y su análisis con fuentes de datos reales. Este es un módulo de transición, orientado a la consolidación de los conocimientos adquiridos en los módulos anteriores y la adquisición de habilidades de análisis que se profundizará en los módulos siguientes. Todo ello con una motivación eminentemente práctica.
Distribución horaria:
Clase 1: Caso de uso de análisis de datos geoespaciales (José Manuel García Nieto)
Clase 2: Caso de uso de análisis de datos geoespaciales, Análisis Avanzado (José Manuel García Nieto)
Clase 3: Caso de uso de análisis de usuarios en red social (José Manuel García Nieto)
Tecnologías: Python, Open Data APIs, MongoBD, Anac onda, Jupyter Notebooks, Spyder y las librerías pymongo, matplotlib, pandas, numpy, folium, entre otras.
Pre – Requisitos: Conocimientos adquiridos en módulos anteriores: Python, MongoBD. Además de los enlaces proporcionados en el campus virtual.
Docentes
José Manuel García Nieto ( jnieto@lcc.uma.es )
Investigador Senior, UMA
Tutorías presenciales Miércoles 16.00 a 19.00. Tutorías virtuales (email, foros, chat, Skype) Jueves 16.00 a 18.00.
Experto en algoritmos de optimización y minería de datos en el contexto del Big Data y la Web Semántica y el análisis del Big Data y su aplicación a problemas de la industria. Imparte el módulo de open data y el caso de uso de Smart cities y redes sociales.
Planificación docente:
Clase 1: Caso de uso de análisis de datos geoespaciales. Toma de contacto con entorno de desarrollo, el conjunto de datos y su carga. Análisis preliminar.
Trabajo previo necesario: Instalación de entorno de desarrollo y prueba Anaconda, MongoBD. Repaso de Python y Mongo.
Tarea 1 (TIP O): Reproducción de los pasos realizados en la carga de datos y el análisis preliminar del conjunto de datos. EL objetivo es que el alumno sea capaz de realizar una búsqueda y carga de datos, su trazado y presentación en notebook Jupyter, además de entender la imprescindible fase de limpiado y normalización de datos. Se espera que el alumno realice la actividad con otras fuentes de datos diferentes a la trabajada en la lección.
Clase 2: Caso de uso de análisis de datos geoespaciales. Análisis avanzado. Trabajo previo necesario: Instalación de entorno de desarrollo y prueba Anaconda, MongoBD. Repaso de Python y Mongo.
Tarea 2 (TIPO): Realización de las fases de análisis explicadas y propuesta de nuevos análisis. EL objetivo es que el alumno sea capaz de proponer y diseñar nuevos análisis de datos alternativos centrados en otras variables dentro del mismo conjunto de datos trabajando en clase.
Tarea 3 (TIPO): Realización de consultas alternativas geoespaciales mediante pymongo y su visualización a través de folium. EL objetivo es que el alumno sea capaz de proponer nuevas consultas de datos alternativos centrados en otras regiones del conjunto de datos trabajando en clase.
Clase 3 : Caso de uso de análisis de usuarios en red social. Exploración del conjunto de datos, carga y análisis preliminar. Trabajo previo necesario: Instalación de entorno de desarrollo y prueba Anaconda, MongoBD. Repaso de Python y Mongo.
Tarea 4 (TIPO): Reproducción de los pasos realizados en la carga de datos y el análisis preliminar del conjunto de datos. EL objetivo es que el alumno sea capaz de realizar una búsqueda y carga de datos, su trazado y presentación en notebook Jupyter, además de entender la imprescindible fase de limpiado y normalización de datos. Se espera que el alumno realice la actividad con otras fuentes de datos diferentes a la trabajada en la lección.
Tarea 5 (TIPO): Realización de las fases de análisis explicadas y propuesta de nuevo cruce de datos con diferentes fuentes. EL objetivo es que el alumno sea capaz de proponer y diseñar nuevos análisis de datos alternativos centrados en variables de diferentes conjuntos de datos a enlazar.
Tarea 6 (TIPO): Realización de filtrado de texto median te expresiones regulares alternativas a las realizadas en clase. EL objetivo es que el alumno sea capaz de proponer nuevos filtrados y clasificaciones de texto y categorías de las palabras clave del conjunto de datos trabajando en clase.
Deja un comentario