Skip to content

Асинхронный парсер документации PEP

Notifications You must be signed in to change notification settings

Alexshifter/scrapy_parser_pep

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Асинхронный парсинг документации Python

Описание проекта

Проект представляет собой консольное приложение для асинхронного парсинга документации c сайта Python.org с помощью библиотеки Scrapy.

Возможности проекта

  • Получение номера, названия и статуса каждого документа PEP
  • Подсчет количества документов PEP в разном статусе, формирование сводной таблицы;
  • Полученные данные выводятся в файлы .CSV с указанием даты и времени в названии.

Установка

Клонируйте репозиторий локально:

git clone [email protected]:Alexshifter/scrapy_parser_pep.git

Находясь в директории проекта разверните виртуальное окружение

python -m venv venv

Запустите виртуальное окружение

source venv/scripts/activate

Обновите pip

pip install --upgrade pip

Установите зависимости

pip install -r requirements.txt

Работа с приложением

Запуск приложения

scrapy crawl pep

Файлы с результатами парсинга доступны в папке results:

cd results

Основные технологии

Python 3.9.13, Scrapy 2.5.1

Автор

Alexey Pakaev

About

Асинхронный парсер документации PEP

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages