kensu-py

Open source some py integration modules to automate Data and Analytics Observability

Data Observability Features

Adds Data Observability capabilities such as lineage tracking, data profiling of input and output data sources, data set and schema discovery for python libraries:

pandas
numpy
scikit-learn
google bigquery
boto3
requests
pysftp
gluonts
psycopg2 (PostgreSQL)

Installation

From pypi

pip install kensu

Development

Build

pip install ".[all]"

Run tests

pip install ".[all]"
CONF_FILE=tests/unit/conf.ini pytest

Usage

Configuration file

The default configuration file is located at the root folder conf.ini. Otherwise, the CONF_FILE environment variable can point to another one.

Configuration keys

General

Connect to API

kensu_ingestion_url
kensu_ingestion_token

Meta information about the python application

project_name
environment
process_name
user_name
code_location

Behavior of the data observability features

do_report: if False, no data observability information are reported
logical_data_source_naming_strategy: TODO - explain data source grouping strategies such as File, ...

Extra libraries support (TODO: to be extracted in different modules)

pandas_support: Boolean
sklearn_support: Boolean
bigquery_support: Boolean
tensorflow_support: Boolean
kensu_sql_parser_url: URL to an external server capable of handling SQL parsing into lineage

Reporters

name: Name of the reporter (currently we use the class name as a convention, such as KafkaReporter, PrintReporter, LoggingReporter, FileReporter, MultiReporter)

Each reporter has its own conf keys.

name=MultiReporter

Dispatches to several reporters

reporters: JSON array of the reporter names, e.g. reporters["KafkaReporter", "FileReporter"]

name=KafkaReporter

bootstrap_servers=[]
topic=kensu-events

FileReporter

file_name=kensu-events.jsonl

LoggingReporter

level=WARN

Data and Analytics Observability platform

Check out Kensu.

Name		Name	Last commit message	Last commit date
Latest commit History 441 Commits
.github		.github
docs/airflow		docs/airflow
kensu		kensu
tests		tests
.gitignore		.gitignore
.test		.test
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
common-requirements.txt		common-requirements.txt
conf.ini		conf.ini
extra.requirements		extra.requirements
pyproject.toml		pyproject.toml
setup.cfg		setup.cfg
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

kensu-py

Data Observability Features

Installation

From pypi

Development

Build

Run tests

Usage

Configuration file

Configuration keys

General

Reporters

name=MultiReporter

name=KafkaReporter

FileReporter

LoggingReporter

Data and Analytics Observability platform

About

Releases 97

Packages

Contributors 10

Languages

License

kensuio-oss/kensu-py

Folders and files

Latest commit

History

Repository files navigation

kensu-py

Data Observability Features

Installation

From pypi

Development

Build

Run tests

Usage

Configuration file

Configuration keys

General

Reporters

name=MultiReporter

name=KafkaReporter

FileReporter

LoggingReporter

Data and Analytics Observability platform

About

Resources

License

Stars

Watchers

Forks

Releases 97

Packages 0

Contributors 10

Languages

Packages