Primera Escuela AME

Ciencia de Datos
23 - 25 Septiembre 2019
Ciudad de México

 

 

 

 

Antecedentes

La Asociación Mexicana de Estadística (AME) solía organizar un congreso anual, sin embargo, a partir de este año, hemos decidido alternar entre congresos y escuelas. Los congresos han consistido en pláticas cortas y sesiones de posters, a diferencia de las escuelas en donde el objetivo es presentar talleres más largos en donde se puedan cubrir temas completos.

Para este primer año, decidimos hacer una escuela de tres días en ciencia de datos. La primer escuela de la AME tendrá lugar en la Ciudad de México del 23 al 25 de septiembre de 2019 dentro de la UNAM.

La escuela consistirá en cuatro talleres de 6 horas cada uno y 3 pláticas de herramientas. Los talleres serán simultáneos, de forma que los asistentes podrán tomar dos talleres. Tanto las pláticas como talleres consisten en temas de interés general, útiles para que el tratamiento de datos sea más sencillo y divertido.

¿A quién va dirigido?

  • Profesionales de áreas técnicas con interés en la ciencia de datos.
  • Académicos que busquen aprender herramientas nuevas del análisis de datos.
  • Estudiantes de últimos semestres de licenciatura o estudiantes de postgrado con interés en el análisis de datos.
  • En general, analistas de datos y/o negocios.

Conferencistas

Image

Jenny Bryan

Ph.D. & M.A. en Biostadística

Forma parte del equipo de Hadley Wickham en RStudio. Desarrolla paquetes de código abierto para que la ciencia de datos sea más rápida, fácil y divertida.

Image

Carlos Lopez

Lic. en Actuaría

Es partidario del software libre, en particular de R. Es técnico académico en el Instituto de Física de la UNAM, en donde aboga por el uso de herramientas de software libre en el área de cómputo de alto rendimiento.

Image

Vianey Leos

Ph.D. en Estadística

Es investigadora post-doctoral en los departamentos de estadística y recursos ambientales en North Carolina State University, con enfoque en modelos de series de tiempo, modelos espacio-estado y espacio-temporal.

Cursos

Image

Andrea Fernández

MSc en Ciencia de Datos

Actualmente es Directora General Adjunta del Servicio Público de Información en el INEGI y es socia fundadora de la Sociedad de Científicos de Datos de México. Ha realizado proyectos de datos como consultora para Autodesk, el Banco Mundial, CIDAC, Segob, INAI, la ciudad de Chicago, el departamento de Energía de EU, entre otros.

Image

Felipe González

PhD. en Matemáticas

Analista de Datos con amplia experiencia en investigación de Mercados y en enseñanza. Ha trabajado en ITAM, Google, LQL y Millward Brown. Sus áreas de mayor interés son: ciencia de datos, visualización y modelación estadística.

Image

Javier Luraschi

Lic. en Matemáticas e Ingeniería en sistemas

Es autor de los paquetes sparklyr, r2d3, mlflow y el libro Apache Spark with R. Trabaja en RStudio y antes trabajó en Microsoft Research. Estudió Ingeniería de Cómputo en la UP y Matemáticas en la UNAM.

 

 

Image

Michael Betancourt

PhD en Estadística Aplicada

Es el principal científico investigador de Symplectomorphic, LLC, donde desarrolla herramientas teóricas y metodológicas para la inferencia bayesiana práctica. También es un desarrollador central de Stan, donde implementa y prueba estas herramientas. Además de impartir tutoriales y talleres sobre inferencia bayesiana con Stan, colabora en análisis en epidemiología, farmacología y física, entre otros.

Programa

DESCRIPCIÓN DE LOS CURSOS

INSTRUCTOR: Andrea Fernández
CURSO: R para análisis de datos usando el Tidyverse
DESCRIPCIÓN: Este taller está dirigido tanto a principiantes como a usuarios familiarizados con R. El Tidyverse es un sistema coherente de paquetes diseñado para ciencia de datos, cubre la importación, manipulación, exploración, visualización y modelación de datos. Las funciones en el Tidyverse comparten una filosofía de diseño común, lo que facilita el flujo de trabajo. Los asistentes aprenderán a realizar tareas básicas de un flujo de análisis de datos (importar, transformar y graficar datos) usando herramientas del Tidyverse.
INSTRUCTOR: Felipe González
CURSO: Análisis de datos
DESCRIPCIÓN: En este curso introductorio se discutirán herramientas prácticas del análisis de datos, incluyendo análisis exploratorio, visualización, e inferencia usando técnicas de remuestreo. Se pretende mostrar la utilidad de estas técnicas en todas las fases del análisis, desde entender dónde debemos enfocar nuestro esfuerzo hasta entender y juzgar modelos y conclusiones.
INSTRUCTOR: Javier Luraschi
CURSO: Computación Distribuida con R y Spark
DESCRIPCIÓN: Taller enfocado en el uso del paquete de R sparklyr que permite la conexión entre R y Spark. Spark se ha convertido en una herramienta popular para interactuar con datos distribuidos, esto gracias a su rápido procesamiento y a la variedad de herramientas que incorpora para procesamiento de datos y machine learning.
INSTRUCTOR: Michael Betancourt
CURSO: Inferencia bayesiana y Stan
DESCRIPCIÓN: El taller se impartirá en inglés y consta de tres módulos: 1) modelación estadística e inferencia bayesiana, 2) cómputo bayesiano y 3) Stan. Incluye ejercicios prácticos en R y Python. La elección de herramientas en proyectos prácticos de ciencia de datos a menudo se restringe a aquellas que son fáciles de implementar y que funcionan de manera eficiente. Tradicionalmente, esto ha descartado muchas técnicas de análisis de datos bayesianos, ya que implican procedimientos de inferencia estadística laboriosos. Esto está cambiando con la ayuda de lenguajes de modelación como Stan. Stan permite estimar una gran variedad de modelos probabilísticos usando técnicas bayesianas. El software realiza varios cálculos automáticamente y también proporciona diagnósticos extensos para la inferencia.

 

REQUISITOS

HORARIOS

LUNES 23 DE SEPTIEMBRE

09:00 - 10:30 Malos olores y buenas sensaciones en programación **
Jenny Bryan
11:00 - 13:00 R para análisis de datos usando el Tidyverse
Andrea Fernández
Inferencia bayesiana y Stan *
Michael Betancourt
13:00 - 14:30 Comida
14:30 - 16:30 Computación Distribuida con R y Spark
Javier Luraschi
Análisis de datos
Felipe González
* Impartido en inglés
** Impartida en inglés con traducción simultanea

 

MARTES 24 DE SEPTIEMBRE

09:00 - 10:30 Análisis reproducible usando Rmarkdown
Carlos Lopez
Desarrollo de paquetes en R (S1) *
Jenny Bryan
11:00 - 13:00 R para análisis de datos usando el Tidyverse
Andrea Fernández
Inferencia bayesiana y Stan *
Michael Betancourt
13:00 - 14:30 Comida
14:30 - 16:30 Computación Distribuida con R y Spark
Javier Luraschi
Análisis de datos
Felipe González
* Impartido en inglés

 

MIÉRCOLES 25 DE SEPTIEMBRE

09:00 - 10:30 Historias con impacto a través de la ciencia de datos
Vianey Leos
Desarrollo de paquetes en R (S2) *
Jenny Bryan
11:00 - 13:00 R para análisis de datos usando el Tidyverse
Andrea Fernández
Inferencia bayesiana y Stan *
Michael Betancourt
13:00 - 14:30 Comida
14:30 - 16:30 Computación Distribuida con R y Spark
Javier Luraschi
Análisis de datos
Felipe González
* Impartido en inglés

 

JUEVES 26 DE SEPTIEMBRE

SESIÓN EXTRA

08:30 - 09:00 Coffee Break
09:00 - 11:00 Flujo de trabajo bayesiano ***
Michael Betancourt
*** Seminario de entrada libre, impartido en inglés en el auditorio del IIMAS, UNAM (independiente del curso de inferencia Bayesiana y Stan)

Localización

Sede: Torre de Ingeniería, UNAM

  • Circuito Escolar S/N Torre de Ingeniería, C.U.,
    C.P. 04510 Ciudad de México, CDMX.
  • (55) 5623-3500
  • Página

¿Cómo llegar?

  • Transporte público. Seguir enlace
  • Para llegar en auto:
    1. Estacionamiento junto a torre. Contamos con un número limitado de lugares de estacionamiento, el costo es de $180 por los tres días y los debes apartar con tu pago por adelantado, si te interesa llena esta forma
    2. Estacionamiento número 6 del estadio olímpico. El estacionamiento tiene un costo de $10 por hora ($20 la primera hora) y para llegar a la torre de ingeniería se debe tomar el pumabus ruta 8 (azúl). Tiempo aproximado de espera y camino 25 minutos.

¿Dónde Comer?

Ciudad Universitaria cuenta con una gran cantidad de locales de alimentos dentro de su campus, una alternativa económica es la cafetería Cibarium que se encuentra a 100 mts. de la Torre de Ingeniería. Otra alternativa es el restaurante Azul y Oro que se encuentra dentro de la Torre de Ingeniería. Así mismo, enfrente del comedor se encuentran una variedad de locales comerciales con diversos productos. Como servicio adicional, se proporcionará una comida sencilla para cada día del evento (bagettes, empanadas o ensaladas) en la explanada adjunta al auditorio.

Registro

CUOTAS

Cupo limitado: 200 personas

MXN Regular Estudiante
Primeros 40 lugares $3400.00 $1900.00
Siguientes 160 lugares $4400.00 $2600.00

CUPO LLENO

Comité Organizador

Anzarut

Michelle Anzarut Dra. en Matemáticas Página

Ortiz

María Teresa Ortiz MA. en Estadística Página

Ayudantes

Antonio Soriano Página

Juan Martínez Github

Sonia Mendizábal Github

Claudia Juárez

Enrique Reyes

Mariana Carmona

Miriam Ramírez

Osvaldo Angtuncio

Patrocinadores

R-Studio RConsortium IIMAS ITAM FacMed UAM-AZC GeekEnd StickerMule TxtLanguage

 

¿Interesado en patrocinar?


Manda un correo electrónico a ame.escuela1@gmail.com para conocer los detalles sobre los niveles de patrocinio disponibles.

¡Contáctanos!

  • Apartado Postal 20-126, Del. Alvaro Obregón
    C.P. 01000, México, CDMX.
  • (55) 5622-3583
  • Correo
  • Página