当前位置:   article > 正文

爬虫高阶(一):解决验证码及爬取知网论文数据

爬虫高阶(一):解决验证码及爬取知网论文数据

爬取知网论文数据

解决验证码

首先我们必须要识别出验证码,才能让进行下一步。

分享一个好用的网站
云码
在这里插入图片描述
接着按照流程操作来得到积分,点击个人中心查看自己的token即可(会用到,一次大约10积分,初始有300免费积分,1元能有1000积分
在这里插入图片描述

实现过程

在这里插入图片描述
我们使用的是DrissionPage这个简单又迅速的库
✨️ 概述

DrissionPage 是一个基于 python 的网页自动化工具

它既能控制浏览器,也能收发数据包,还能把两者合而为一。

可兼顾浏览器自动化的便利性和 requests 的高效率。

它功能强大,内置无数人性化设计和便捷功能。

它的语法简洁而优雅,代码量少,对新手友好。

项目地址:gitee

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/羊村懒王/article/detail/282014
推荐阅读