中小学教材下载爬虫
代码
运行
- 人教版:
python pep_book.py
- 凤凰版:
python phoenix.py
一些要点
- 使用 pathlib 库,可自动创建多级目录
- 下载PDF时使用iter_content方法分块下载,减少内存消耗
本作品采用《CC 协议》,转载必须注明作者和本文链接
推荐文章: