Skip to content

Conjunto de dados, parte do projeto final do curso de Análise de Dados ministrado por Toti, oferece uma visão aprofundada do comportamento e padrões de compra dos consumidores. É essencial para as empresas adaptarem produtos, estratégias de marketing e melhorarem a experiência do cliente.

Notifications You must be signed in to change notification settings

sulasoft/Projeto-final-da-Toti-Analise-de-Dados-Turma34

Repository files navigation

Conjunto de Dados de Preferências de Compras do Cliente 🛍️

Este conjunto de dados, parte do projeto final do curso de Análise de Dados ministrado por Toti, oferece uma visão aprofundada do comportamento e padrões de compra dos consumidores. É essencial para as empresas adaptarem produtos, estratégias de marketing e melhorarem a experiência do cliente. Com 3900 registros, abrange informações-chave como idade, gênero, histórico de compras, métodos de pagamento preferidos, frequência de compras e mais. Ideal para iniciantes em Análise de Dados, este conjunto sintético fornece uma base sólida para a tomada de decisões baseada em dados e estratégias centradas no cliente.

Power BI Design 1

Como Utilizar

Certifique-se de ter o Python >= 3.9 e todas as dependências instaladas antes de executar os scripts. Você pode instalá-las usando:

pip install -r requirements.txt

O script principal main.py coordena várias tarefas essenciais para o projeto. Abaixo estão detalhados os passos do processo:

  1. Limpeza de Dados: Execute o script clean_data.py para limpar os dados do CSV original.
  2. Criação do Banco de Dados: Utilize o script criar_db.py para criar o banco de dados (moda_estilos.db).
  3. Inserção de Dados: O script csv_to_db.py executa a inserção de dados do CSV no banco de dados.

Para executar o script principal, utilize o seguinte comando:

python main.py

Script clean_data.py

O script clean_data.py realiza várias operações para limpar e enriquecer o conjunto de dados original:

  1. Ler o CSV Original: Utiliza o pandas para ler o arquivo CSV original (shopping_trends_updated.csv) e carregar os dados em um DataFrame.
  2. Criar a Coluna 'Localização': Adiciona uma nova coluna chamada 'Localização', atribuindo cidades brasileiras aleatórias a cada linha.
  3. Adição das Colunas 'Item Comprado' e 'Categoria': Gera aleatoriamente produtos para a coluna 'Item Comprado' e atribui categorias a esses produtos.
  4. Mapeamento de Categorias: Define um mapeamento de categorias para atribuir categorias aos itens comprados.
  5. Função para Atribuir Categorias: Define uma função que atribui categorias conforme o mapeamento definido.
  6. Aplicação da Função para Atribuir Categorias: Aplica a função para atribuir categorias aos itens comprados e cria a coluna 'Categoria'.
  7. Lista de Métodos de Pagamento e Adição da Coluna 'Método de Pagamento': Adiciona uma coluna 'Método de Pagamento' com métodos de pagamento brasileiros aleatórios a cada linha.
  8. Salvamento do DataFrame em um Novo Arquivo CSV: Salva o DataFrame atualizado em um novo arquivo CSV (shopping_trends_clean.csv).

Este script enriquece o conjunto de dados original com informações adicionais, como localização, item comprado, categoria e método de pagamento, antes de salvar em um novo arquivo CSV.

Script criar_db.py

O script criar_db.py cria e configura um banco de dados SQLite:

  1. Conectar ao Banco de Dados SQLite: O script se conecta ao banco de dados SQLite (criará um novo arquivo se não existir).
  2. Criar Tabela 'clientes': Cria uma tabela chamada 'clientes' com informações sobre os clientes, como idade, gênero, localização, status da assinatura, compras anteriores, método de pagamento e frequência de compras.
  3. Criar Tabela 'items': Cria uma tabela chamada 'items' que armazena informações sobre os itens disponíveis para compra, como nome do item, categoria, valor, tamanho, cor e temporada.
  4. Criar Tabela 'compras': Cria uma tabela chamada 'compras' que registra informações sobre cada compra, incluindo valor da compra, avaliação, tipo de envio, desconto aplicado, código promocional usado, e referências às tabelas 'clientes' e 'items'.
  5. Fechar a Conexão: Finaliza a conexão com o banco de dados SQLite.

Este script é fundamental para a estruturação do banco de dados usado no projeto, definindo as tabelas e suas relações.

Script csv_to_db.py

O script csv_to_db.py adiciona dados do arquivo CSV ao banco de dados SQLite:

  1. Conectar ao Banco de Dados SQLite: O script se conecta ao banco de dados SQLite (moda_estilos.db).
  2. Ler o CSV: Utiliza o pandas para ler o arquivo CSV limpo (shopping_trends_clean.csv).
  3. Adicionar Dados à Tabela 'clientes': Seleciona as colunas relevantes do DataFrame e adiciona os dados à tabela 'clientes' no banco de dados.
  4. Adicionar Dados à Tabela 'items' e Eliminar Duplicados: Seleciona as colunas relevantes do DataFrame e adiciona os dados à tabela 'items', eliminando duplicatas com base no nome do item.
  5. Verificar Valores Nulos e Inexistentes na Coluna 'Item Comprado': Verifica se há valores nulos na coluna 'Item Comprado' e se todos os itens existem na tabela 'items'.
  6. Adicionar Dados à Tabela 'compras': Seleciona as colunas relevantes do DataFrame e adiciona os dados à tabela 'compras', mapeando os IDs correspondentes dos itens.
  7. Fechar a Conexão: Finaliza a conexão com o banco de dados SQLite.

Este script é responsável por transferir os dados do arquivo CSV para o banco de dados SQLite, garantindo a integridade e consistência dos dados.

Importação no Power BI

Com os dados do CSV já inseridos no banco de dados SQLite, você pode prosseguir com a importação desses dados no Power BI. Aqui estão os passos para realizar a importação utilizando a conexão via SQLite e ODBC:

Conexão via SQLite:

  1. Baixe e Instale o Driver SQLite: Certifique-se de ter o driver SQLite instalado no seu sistema.
  2. Abra o Power BI: Inicie o Power BI Desktop.
  3. Escolha 'Obter Dados': Na guia "Página Inicial", escolha a opção "Obter Dados" e selecione "Outros" para ver mais opções.
  4. Escolha 'ODBC': Selecione "ODBC" e escolha o driver ODBC para SQLite.
  5. Configure a Conexão: Insira as informações necessárias, como o nome do arquivo do banco de dados SQLite e as credenciais, se aplicável.
  6. Selecione Tabelas: Selecione as tabelas desejadas (clientes, items, compras) para importar no Power BI.

Conexão via ODBC:

  1. Configure uma Fonte de Dados ODBC (ProjetoBI): Certifique-se de ter uma fonte de dados ODBC configurada com o nome "ProjetoBI" para o seu banco de dados SQLite.
  2. Abra o Power BI: Inicie o Power BI Desktop.
  3. Escolha 'Obter Dados': Na guia "Página Inicial", escolha a opção "Obter Dados" e selecione "Outros" para ver mais opções.
  4. Escolha 'ODBC': Selecione "ODBC" e escolha a fonte de dados ODBC configurada. (ProjetoBI)
  5. Selecione Tabelas: Selecione as tabelas desejadas (clientes, items, compras) para importar no Power BI.

Após a configuração da conexão, você poderá explorar e visualizar os dados do seu banco de dados SQLite diretamente no Power BI, permitindo a criação de relatórios e dashboards interativos.

🌟 Informações Adicionais

Os dados utilizados neste projeto foram obtidos do Kaggle. Você pode encontrar o conjunto de dados em Customer Shopping Trends Dataset.

Este projeto foi desenvolvido como parte do curso de Análise de Dados ministrado por Toti.

Contribuidores ✨

David Sulbarán
Samil Moret

About

Conjunto de dados, parte do projeto final do curso de Análise de Dados ministrado por Toti, oferece uma visão aprofundada do comportamento e padrões de compra dos consumidores. É essencial para as empresas adaptarem produtos, estratégias de marketing e melhorarem a experiência do cliente.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages