Skip to content

练习使用 Python 内置的 urllib 和 HTMLParser 库爬取三秋书屋电子书的百度网盘链接和提取码

Notifications You must be signed in to change notification settings

shuxiaoyuan/SanQiuBooksSpider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 

Repository files navigation

SanQiuBooksSpider

用途

使用 Python 内置的 urllib 和 HTMLParser 库爬取三秋书屋电子书的百度网盘链接和提取码。

说明

Python 这两个内置的库都不是很好用,特别是 HTMLParser 解析器,需要自己写很多底层实现,不如 xpath 和 BeautifulSoup 等第三方库使用起来方便, 写这个爬虫仅仅是为了练习这两个库的使用。另外这个网站负载能力比较弱,不要频繁请求。

About

练习使用 Python 内置的 urllib 和 HTMLParser 库爬取三秋书屋电子书的百度网盘链接和提取码

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages