Python para Estatística é um grupo de estudos de Python para análise de dados. Os estudos irão enfatizar algoritmos, lógica de programação e estrutura de dados em Python, manipulação e visualização de dados, estatística descritiva e ajuste de modelos de regressão
A jornada de estudos aconteceu em 5 módulos de 2 horas cada nos dias 15, 17, 19, 24 e 26 de Janeiro de 2018, no período das 14h às 16h no Laboratório de Estatística e Geoinformação (LEG, prédio do Setor de Ciências Exatas, sala 232).
O grupo de estudos foi coordenado pelos professores Wagner Bonat, Walmes Zeviani e Fernando Mayer (LEG/DEST).
- Configuração do ambiente e estruturas de programação
(
aula-1-intro.ipynb
).- Download e instalação do Python e editores.
- Módulos, aritmética, lógica, objetos.
- Controles de execução e funções.
- Álgebra matricial e otimização com
numpy
(aula-2-numpy.ipynb
).- Operações matriciais.
- Distribuições de probabilidade.
- Otimização numérica.
- Manipulação de dados com
pandas
(aula-3-pandas.Rmd
).- Leitura de dados no formato texto.
- Medidas descritivas.
- Manipulação de dados.
- Tarefas de split-apply-combine.
- Visualização de dados com
matplotlib
(aula-4-visualizacao.Rmd
).- Gráficos para uma variável.
- Gráficos para pares de variáveis.
- Modelagem estatística (
aula-5-model.ipynb
).- Modelos de regressão.
- Grus, J. (2015). Data science from scratch: first principles with Python. Sebastopol, CA: O'Reilly.
- Hilpisch, Y. (2014). Python for finance. Sebastopol, CA: O'Reilly Media.
- Dale, K. (2016). Data visualization with Python and JavaScript: scrape, clean, explore & transform your data. Sebastopol, CA: O'Reilly Media.
- Menezes, N. N. C. (2014). Introdução a programação com Python: algoritmos e lógica de programação para iniciantes. Novatec, 2014.