赞
踩
下面我们点击create new sitemap,然后点击create sitemap (创建网站地图),打开后会有name和URL选项
第一次进行爬虫练习选择爬取哔哩哔哩首页的视频name
点击create sitemap
然后Add new selector
Select选择在页面进行操作:
最后点击Save selector
进行爬取
设置页面加载延迟,防止访问太快
然后点击start scraping开始爬取
当窗体一闪而过就说明爬取成功
可以去把爬取到的数据
下载到本地了
由于bilibili每次打开都会刷新页面所以每次爬取到的name不一样
这就是进行简单使用web Scraper.
下面将会去学习如何将全部数据都爬取下来,以及控制链接参数实现翻页功能等。
**相比前面学习的爬虫框架之类的,这个插件可以说是大大提高工作效率(不用去写复杂代码了,提供了摸鱼时间)。有时站在巨人的肩膀上看世界还是很舒服的。**
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。