Toolkit de Exploração de Dados na AWS

Visão Geral

O datadelivery é um módulo Terraform que permite com que seus usuários criem recursos de infraestrutura em suas respectivas contas AWS visando aprimorar os primeiros passos na exploração de dados utilizando serviços de Analytics. Isto é feito através de processos já embarcados no módulo, tais como:

🪣 Criação de buckets S3 seguindo uma arquitetura Data Mesh ou arquitetura medalhão
🎲 Upload automático de datasets públicos em bucket S3
📦 Upload opcional de datasets customizados fornecidos pelo usuário
⏳ Agendamento automático de um Glue Crawler para criação de tabelas para os datasets
🔒 Criação de policies e roles IAM para execução do Glue Crawler
📈 Criação de um workgroup do Athena para facilitar a execução de queries

Quickstart

Qualquer usuário que tenha um projeto Terraform pode realizar a chamada ao módulo datadelivery passando, como fonte, a referência deste repositório no GitHub:

# Chamando o módulo datadelivery com as configurações padrão
module "datadelivery" {
  source = "git::https://github.com/ThiagoPanini/datadelivery"
}

Variáveis

O módulo datadelivery possibilita algumas customizações específicas de seus recursos implantados através do fornecimento de algumas variáveis que podem ser configuradas em tempo de chamada.

Para acessar a lista completa de variáveis atualmente aceitas pelo módulo, consulta sua página oficial de documentação.

Readthedocs

📚 Para saber mais sobre essa iniciativa, acesse a página oficial de documentação do módulo. Lá, os usuários poderão encontrar todos os detalhes de construção da solução, demonstração de etapas, visão de arquitetura, entre outros tópicos relevantes.

Entre em Contato

GitHub: @ThiagoPanini
LinkedIn: Thiago Panini
Hashnode: panini-tech-lab
DevTo: thiagopanini

Referências

Terraform

Terraform - Creating Modules
Terraform - Using Modules
Terraform - Module Sources
Medium - Maintaining Reusable Terraform Modules
Terraform - Filesystem and Workspace Info

AWS Glue

Glue Crawler Prerequisites

GitHub

GitHub - terraform-validate Action

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Toolkit de Exploração de Dados na AWS

Visão Geral

Quickstart

Variáveis

Readthedocs

Entre em Contato

Referências

Files

README.md

Latest commit

History

README.md

File metadata and controls

Toolkit de Exploração de Dados na AWS

Visão Geral

Quickstart

Variáveis

Readthedocs

Entre em Contato

Referências