Como diz a ementa, o propósito desta disciplina é expor a estudante aos princípios básicos da modelagem estatística, em particular aos modelos de regressão. Para auxiliar a busca pelo conhecimento, há uma bibliografia comentada aqui.
AVISO 0: todos os documentos listados aqui serão atualizados à medida que o curso avança.
AVISO 1: caso haja dificuldade em obter quaisquer dos materiais listados (PDFs de artigos, por exemplo), entrar em contato com o professor para que eu possa compartilhar o material para fins acadêmicos e de uso pessoal.
AVISO 2: Os materiais listados neste repositório são adicionais à bibliografia recomendada (ver abaixo).
Monitores: Eduardo Adame e Ezequiel Braga.
- Lição 1: Inferência aproximada: o valor de uma premissa.
- Lição 2: Modelos, hipóteses e a lógica da ciência.
- Lição 3: Regressão linear: o melhor modelo ruim que você já viu.
- Lição 4: Regressão linear múltipla: the madness continues.
- Lição 5: Regressão linear múltipla bayesiana: 🎶_girl put your Bayesian hat on_🎶:.
- 2023.
- [ROS] Gelman, A., Hill, J., & Vehtari, A. (2020). Regression and other stories. Cambridge University Press.
- [SR] McElreath, R. (2020). Statistical rethinking: A Bayesian course with examples in R and Stan. Chapman and Hall/CRC.
- [GH] Gelman, A., & Hill, J. (2006). Data analysis using regression and multilevel/hierarchical models. Cambridge university press.
- [DB] Dobson, A. J., & Barnett, A. G. (2018). An introduction to generalized linear models. CRC press.
- [FH] Fahrmeir, L., Kneib, T., Lang, S., & Marx, B. (2013). Regression: Models, Methods and Applications. Springer Science & Business Media.
- [MN] McCullagh, P., & Nelder, J. A. (1989). Generalized Linear Models (Vol. 37). CRC Press.
- 2024-04-03: (alguns) Exercícios de revisão para a A1 aqui.
- SR Ch1;
- Box (1976). Science and statistics. Journal of the American Statistical Association, 71(356), 791-799;
- Nester (1996). An applied statistician's creed. Journal of the Royal Statistical Society: Series C (Applied Statistics), 45(4), 401-410.
- Teorema de Gauss-Markov;
- Teorema de Frish-Waugh-Lovell;
- Linear models can’t keep up with sport gender gap.
- Uma explicação intuitiva da "hat matrix" ou matriz de projeção H está nesta resposta no CrossValidated.
Os conjuntos de notas a seguir cobrem mais ou menos o mesmo material, com abordagens levemente diferentes.
- Notas do grande Sudipto Banerjee;
- Notas de Thomas Minka.
- Monografia de J. Andrés Christen.
- Esses dois videos (em inglês) do canal Mutual Information de Duane Rich são bem interessantes: parte 1 and parte 2
- Mccullagh & Nelder (1989) "Generalised linear models". [PDF].
- Notas sobre a derivação do AIC e BIC. Notem como para o modelo linear, os critérios de informação podem ser escritos em função da soma de quadrados. Acidente?
- Sakia, (1992). The Box‐Cox transformation technique: a review. Journal of the Royal Statistical Society: Series D (The Statistician), 41(2), 169-178.
- Alin (2010). Multicollinearity. Wiley interdisciplinary reviews: computational statistics, 2(3), 370-374.
- Why hierarchical models are awesome, tricky, and Bayesian;
- Parametrização centrada vs não-centrada: link.
- Simpson's paradox, Seção 5;
- Does model averaging make sense?.
- Modelos com inflação de zeros (e hurdle models): (i) Seção relevante do Stan guide, (ii) Post no StackExchange e (iii) Discussão sobre hurdle models no StackExchange.
-
Neste FAQ, Ben Bolker explica os principais tipos de modelos que podem ser ajustados com o pacote lme4 do R, e, mais importante, discute as diferenças terminológicas que tão frequentemente causam confusão -- vide distinção entre "fixed" e "random" factors.
-
O livro de Douglas Bates sobre como usar o lme4 para ajustar modelos "mistos".
-
Dados de
GH
costumam ficar aqui. Como backup, usar este repo. -
Os dados de
ROS
têm repositório próprio, aqui.