ETL_con_API_Publica

Proyecto en que se crean 3 microservicios en FastAPI para extraer datos de una API pública y se despliega usando Google Cloud Run.

Descripción del Proyecto: Plataforma de Análisis de Datos del Anime Naruto

Este proyecto se centra en el desarrollo de una plataforma web para el análisis y la extracción de datos del popular anime "Naruto". Consta de tres aplicaciones principales implementadas como microservicios, cada una cumpliendo un rol específico en el procesamiento y entrega de información:

Extract-Service: Este servicio se encarga de extraer datos de una API externa que contiene información extensa sobre personajes del anime "Naruto". Utiliza la API pública proporcionada por narutodb.xyz para acceder a datos detallados como habilidades, afiliaciones y más, facilitando una recopilación exhaustiva de información.
Transform-Service: El servicio de transformación toma los datos extraídos por Extract-Service y realiza un filtrado y procesamiento específico. Se enfoca en identificar y seleccionar los personajes principales del anime, agrupándolos por clanes y categorizando los ninjas más destacados. Esta fase de transformación permite optimizar la información para su análisis y posterior consumo.
Load-Service: Finalmente, Load-Service proporciona una interfaz para que los usuarios descarguen los datos procesados en formato CSV. Este servicio permite a los usuarios obtener fácilmente la lista filtrada de los ninjas principales, organizada por clanes, facilitando su uso en análisis posteriores o integración con otras herramientas.

Estructura del proyecto en local:

├── LICENSE
├── README.md
├── __init__.py
├── docker-compose.yml
├── extract-service
│   ├── Dockerfile  
│   ├── __init__.py
│   ├── app.py
│   ├── environment.py
│   └── requirements.txt
├── load-service
│   ├── Dockerfile   
│   ├── __init__.py
│   ├── app.py
│   ├── environment.py
│   └── requirements.txt
├── transform-service
│   ├── Dockerfile
│   ├── __init__.py
│   ├── app.py
│   ├── constants.py
│   ├── environment.py
│   └── requirements.txt

En producción se agrega:

├── deploy
│   └── prod
│       ├── Dockerfile_extract
│       ├── Dockerfile_load
│       ├── Dockerfile_transform
│       ├── cloudbuild_extract.yaml
│       ├── cloudbuild_load.yaml
│       └── cloudbuild_transform.yaml
├── deploy.sh

Microservicios:

extract-service: Servicio encargado de extraer datos.
transform-service: Servicio encargado de transformar datos.
load-service: Servicio encargado de cargar datos.

Comunicación entre Servicios:

Los servicios se comunican entre sí a través de una red Docker interna (my-network en el entorno de desarrollo y comunicación directa en producción usando URLs específicas).

Empaquetado con Docker:

Cada servicio está empaquetado en un contenedor Docker individual para el despliegue local dentro de cada app independiente.
En producción se tienen Dockerfiles específicos para cada servicio (Dockerfile_extract, Dockerfile_transform, Dockerfile_load).

Despliegue en Servidor:

En desarrollo local, se utiliza un docker-compose.yml para orquestar los servicios y facilitar la comunicación:

	 docker-compose up -d --build

En producción, se utiliza Google Cloud Run para desplegar cada servicio de manera independiente a través de Cloud Build.

Hay un manejador en el archivo deploy.sh que se encarga del depliegue (en Linux):

#En Local:
sudo chmod +x deploy.sh
./deploy.sh -l

Una vez montados los contenedores, para usar el servicio de Load que es quien da el producto final ingresamos a:

http://127.0.0.1:8005/exportar_csv

Y obtenemos el resultado, un discriminado de ninjas principales por clanes.

#En producción
sudp chmod +x deploy.sh
./deploy.sh -p

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ETL_con_API_Publica

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
deploy/prod		deploy/prod
extract-service		extract-service
load-service		load-service
transform-service		transform-service
.gitignore		.gitignore
Arquitectura_microservicios.png		Arquitectura_microservicios.png
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
deploy.sh		deploy.sh
docker-compose.yml		docker-compose.yml

License

hdballestan/ETL_con_API_Publica

Folders and files

Latest commit

History

Repository files navigation

ETL_con_API_Publica

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages