- Mathematical optimization and symbolic computing
- Linear Regression
- Logistic Regression
- Neural Networks
- Regularization and performance evaluation
- Kernel methods
- Ensemble methods
- Learning representations
- Deep learning
40% Problemsets
30% Quizes
30% Data analytics project
- EDX Machine Learning Fundamentals UCSanDiegoX: DSE220x 10 semanas
- UDACITY Google Deep Learning Course 7 lecciones
Usaremos esta máquina virtual que tiene instalado un entorno Python Anaconda con Jupyter Notebooks disponibles en localhost:8008 una vez que la máquina arranca.
Observa la configuración de la máquina
- Si tu máquina física tiene al menos 4GB de memoria configura la máquina virtual con 2GB de memoria
- Aunque casi no necesitarás un terminal, el interfaz de Jupyter Notebooks tiene un terminal para acceder a través del navegador. En cualquier caso, la máquina virtual tiene un servidor SSH en el puerto 2222 con user/user como usuario y pwd. Si tu máquina física es mac o linux usa
ssh -p 2222 user@localhost
para conectarte. Si es windows, usa putty - Si compartes una carpeta entre la física y virtual asegúrate que el nombre cone el que se comparte sea
share
(aunque el nombre de la carpeta en la máquina física puede ser distinto)
Deberás de abordar un problema de analítica de datos, 1) elegir dataset, 2) definir tarea, 3) implementar la analítica de datos. El resultado ha de ser un notebook ejecutable que contenga, preprocesado (latent semantics y/o transformaciones), varios algoritmos de clasificación o regresión, análisis de rendimiento y curvas de aprendizaje.
Hay muchas fuentes de datos y sitios de competiciones de machine learning en internet, entre ellas: kaggle, kdnudgets
Un archivo PDF llamado PROJECT_description.pdf donde se describa brevemente (2 páginas máximo):
- el problema a abordar (p.ej. los fallos en producción de una fábrica suponen un coste de tanto)
- el dataset (p.ej. datos de ventas + datos de sensores en máquinas de producción)
- la tarea de machine learning (p.ej. detectar anomalías en producción y medir su impacto en costes)
Un archivo PDF llamado PROJECT_final_report.pdf donde se incluya un resumen del desarrollo del proyecto que incluya:
- descripción del preprocesado de datos.
- estrategias de generación de modelos predictivos.
- resúmen de resultados predictivos y su impacto en el problema abordado.
Una carpeta llamada PROJECT_notebooks_and_data donde se incluyan los notebooks y datos que realizaste para el desarrollo del proyecto, desde los cuales se puedan reproducir los resultados que expongas en el reporte final.
TUS RESULTADOS HAN DE SER REPRODUCIBLES, si no es así, LA ENTREGA NO SERÁ VÁLIDA
Criterios de evaluación:
- Claridad y precisión de la primera entrega.
- Claridad y coherencia del reporte final.
- Coherencia de la evidencia analítica generada (i.e. estabilidad de los resultados de predicción, corrección de los procesos de validación y selección de modelos, etc.).