Predicción de variables hidrológicas y climatológicas:
Modelos basados en árboles de decisión con R
Johanna Orellana Alvear, MSc, Universidad de Cuenca
Instructora
12 al 16 de noviembre de 2018
Descripción
El uso de técnicas de machine learning se ha incrementado en diferentes líneas de investigación en el área de recursos naturales. La aplicación más importante radica en pronósticos de diferente índole (i.e., clasificación y regresión) sobre variables de interés hidrológico y climatológico. A pesar de ser técnicas novedosas y de resultados satisfactorios, su conocimiento y utilización son limitados a nivel local y regional.
Por esta razón, el Departamento de Recursos Hídricos y Ciencias Ambientales (iDRHiCA) de la Universidad de Cuenca oferta este curso de educación continua, con el objetivo de difundir el uso de técnicas de inteligencia artificial y proveer a los profesionales de herramientas para el desarrollo de modelos para pronóstico de variables hidrológicas y climatológicas basados en datos (data-driven models).
Una de las técnicas más sencillas y ampliamente utilizada son los Arboles de Decisión y extensiones de tipo ensamblador como Random Forest. Este curso surge con el propósito de proveer una introducción conceptual y la oportunidad de efectuar aplicaciones ‘hands-on’ usando árboles de decisión en el lenguaje de programación R.
El curso introducirá los tipos de objetos básicos de R con particular énfasis en factores y data frames, así como la selección de subconjuntos de datos. Posteriormente se revisarán los conceptos de árboles de decisión, su construcción y evaluación. Finalmente se abordará el modelo random forest para clasificación, calibración, evaluación y análisis de importancia de features usando el software R en base a la librería Random Forest.
Perfil de ingreso
El curso está dirigido a investigadores en áreas de ingeniería, recursos naturales, recursos hídricos, ciencias forestales entre otras.
Contenido
A. Básicos de R (5.5 horas)
- Entorno de Rstudio
- Asignación de Variables
- Vectores y Matrices
- Factores – variables categoricas
- Data Frames y listas
- Subconjuntos de datos
B. Arboles de decisión (11 horas)
- Introducción a árboles de clasificación
- Ventajas de métodos basados en arboles
- Predicción con árboles de decision
- Proceso de modelacioón
- División de datos: Train-test
- Entrenamiento y evaluacion modelo de árbol de clasificación
- Matriz de confusión
C. Random Forest (11 horas)
- Introducción a Random Forest
- Entrenamiento de un modelo de Random Forest
- Evaluación de out-of-bag error
- Evaluación del rendimiento del modelo Random forest
- Calibración de hyper-parmetros en un modelo Random Forest
- Importancia de features
D. Trabajo autónomo con tutoría virtual (12.5 horas)
Detalles del curso
Fechas clave | 22 Octubre: Apertura de inscripciones 05 Noviembre: Cierre de inscripciones 12 al 16 de noviembre de 2018: Desarrollo del curso 28 Noviembre: Entrega de trabajo final |
Horario | 8:00 a 13:30 pm |
Carga horaria | Total: 40 horas. 27.5 Presenciales y 12.5 de trabajo autónomo |
Lugar de instrucción | Aula Virtual del Campus Balzay, Universidad de Cuenca |
Cupo | 25 personas |
Perfil del participante | El curso está dirigido a investigadores o estudiantes de últimos años en áreas de ingeniería, recursos naturales, recursos hídricos, ciencias forestales, entre otras. |
Requisitos | El curso de Hidroinformática Aplicada ofertado en iDRHiCA es habilitante para este curso. Para quienes no tengan experiencia previa en R se recomienda la preparación anticipada con recursos introductorios sobre R. Considere, por ejemplo, los cursos disponibles en DataCamp y Coursera. La sección A del contenido cubrirá comandos básicos de R brevemente. Se debe traer computadora personal con R y RStudio instalados. |
Instructora | Johanna Orellana Alvear MSc en Inteligencia Artificial, KU Leuven Actualmente es investigadora doctoral en el Laboratory for Climatology and Remote Sensing de la Philipps Universität Marburg, Alemania , e iDRHiCA.
|
Costo | Profesionales: US$ 150 Personal y estudiantes de la Universidad de Cuenca: US$ 70 |
Costo incluye | Inscripción Material didáctico Refrigerio en el receso Certificado de asistencia o de aprobación. Los estudiantes que aprueben satisfactoriamente el trabajo final de curso recibirán un certificado de “Aprobación”, caso contrario el certificado será de “Asistencia”. |
*Para mayor información puede contactarse al correo electrónico: info_drh@ucuenca.edu.ec