一直想写一个系列博客, 也一直想总结一下自己学习Scrapy遇到的坑和学习到的姿势, 所以有了一下几篇Scrapy的系列博客, 如有错误欢迎指出 :)
其中每篇文章侧重点都不相同
每篇的侧重如下所示:
- StackOverFlow : 引自Scrapy官方的例子, 主要介绍Scrapy, 作为
入门
用途。 - 极客学院视频 : 用来抓取极客学院网站的8000多个视频名字和链接地址等, 主要看点是
带cookie请求
和多页面抓取
。 - 豆瓣电影Top250 : 用来抓取豆瓣上排名前250名的电影, 主要看点是
CrawlSpider
爬虫类的使用,Rule
的使用方法, 以及Scrapy自带的图片下载
。 - “一个”整站爬取 : 用来抓取“一个”上的图片, 名言, 文章和问答, 主要看点是
多页面
,多Item
和图片下载
。
项目代码, 点我下载。
未完待续…