Асинхронный парсинг документации Python

Описание проекта

Проект представляет собой консольное приложение для асинхронного парсинга документации c сайта Python.org с помощью библиотеки Scrapy.

Возможности проекта

Получение номера, названия и статуса каждого документа PEP
Подсчет количества документов PEP в разном статусе, формирование сводной таблицы;
Полученные данные выводятся в файлы .CSV с указанием даты и времени в названии.

Установка

Клонируйте репозиторий локально:

git clone [email protected]:Alexshifter/scrapy_parser_pep.git

Находясь в директории проекта разверните виртуальное окружение

python -m venv venv

Запустите виртуальное окружение

source venv/scripts/activate

Обновите pip

pip install --upgrade pip

Установите зависимости

pip install -r requirements.txt

Работа с приложением

Запуск приложения

scrapy crawl pep

Файлы с результатами парсинга доступны в папке results:

cd results

Основные технологии

Python 3.9.13, Scrapy 2.5.1

Автор

Alexey Pakaev

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Асинхронный парсинг документации Python

Описание проекта

Возможности проекта

Установка

Работа с приложением

Основные технологии

Автор

About

Releases

Packages

Languages

Alexshifter/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Асинхронный парсинг документации Python

Описание проекта

Возможности проекта

Установка

Работа с приложением

Основные технологии

Автор

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages