赞
踩
网络爬虫又被称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取网络信息的程序或者脚本,另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。
简单来讲,爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,点点按钮,查查数据,或者把看到的信息背回来。就像一只虫子在一幢楼里不知疲倦地爬来爬去。
你可以简单地想象:每个爬虫都是你的「分身」。就像孙悟空拔了一撮汗毛,吹出一堆猴子一样
百度: 其实就是利用了这种爬虫技术:每天放出无数爬虫到各个网站,把他们的信息抓回来,然后化好淡妆排着小队等你来检索
抢票软件: 就相当于撒出去无数个分身,每一个分身都帮助你不断刷新 12306 网站的火车余票。一旦发现有票,就马上拍下来,然后对你喊:土豪快来付款
总结: 你基本可以认为你能用浏览器,各种手机app等网络软件做的事情,爬虫都可以做,只不过爬虫可以不舍昼夜的同时比你快n倍的去做这些事情
爬虫的「骚操作」 爬虫也分善恶
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。