爬虫练手:python爬取学校图片网图片

By | 2016-06-05

下午在图书馆无心复习,琢磨着学校图片网的图片挺好看的,最后决定练一下手。

scau_image_spider1.tmp

入口页面

scau_image_spider2.tmp

第二级页面

最终需要获取图片的页面

这三级的页面都不算复杂,比较容易分析出策略。本次爬取中,第一第二级只是获取下一级url。第三级获取img。下图为成果。

scau_image_spider4.tmp

爬取结果

爬完看了一下,才380多张。还以为图片网至少1000+图片的。

发表评论

电子邮件地址不会被公开。