O processo de clipagem demanda tempo, principalmente por ser necessário acessar a vários sites de para coletar as informações. Nesta aplicação, com o uso do robô Puppeter, será possível realizar um Web scraping coletando as páginas principais de cada site de notícia. Sendo possível ter o resultado no formato png ou pdf.
PNG: o usuário será direcionado para as últimas notícias publicadas em cada site
PDF: Será coletada todas as notícias da paǵina incial do site e retornar em um arquivo pdf onde cada matéria será clicável, sendo possível acessar o conteúdo no navegador.
- Acessar sites de notícia;
- Salvar no formato png;
- Salvar no formato pdf;
- Pdf com notíciais clicáveis.
- NodeJS
- Puppeteer
- VS Code
Clonar repositório:
$ git clone https://github.com/KarllaNascimento/webScrapingNoticias.git
Instalar dependências:
- 1 - npm init -y
- 2 - npm i puppeteer