如何改写爬虫验证码登录功能以适应长尾词视频内容抓取?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1842个文字,预计阅读时间需要8分钟。
目标:爬取自己账号中购买的课程视频。
一、实现登录账号- 使用手动输入验证码的方式登录,这里采用手动输入验证码的方式。- 对于有能力的用户,也可以通过图像识别的方式自动填写验证码。
登录后,使用session保持登录状态。
目标:爬取自己账号中购买的课程视频。
一、实现登录账号
这里采用的是手动输入验证码的方式,有能力的盆友也可以通过图像识别的方式自动填写验证码。登录后,采用session保持登录。
1.获取验证码地址
第一步:首先查看验证码对应的代码,可以从图中看到验证码图片的地址是:per.enetedu.com/Common/CreateImage?tmep_seq=1613623257608
颜色标红的部分tmep_seq=1613623257608,是为了解决浏览器缓存问题加的时间戳,因此真正的验证码图片地址是:per.enetedu.com/Common/CreateImage
第二步:找出登录时提交的表单内容和POST地址。
(1) 不填写用户名密码和验证码,直接点击登录,使用Chrome浏览器的Network检查,找到POST地址:per.enetedu.com/AdminIndex/LoginDo
(2) 继续向下看,找到提交的表单 Form Data。
本文共计1842个文字,预计阅读时间需要8分钟。
目标:爬取自己账号中购买的课程视频。
一、实现登录账号- 使用手动输入验证码的方式登录,这里采用手动输入验证码的方式。- 对于有能力的用户,也可以通过图像识别的方式自动填写验证码。
登录后,使用session保持登录状态。
目标:爬取自己账号中购买的课程视频。
一、实现登录账号
这里采用的是手动输入验证码的方式,有能力的盆友也可以通过图像识别的方式自动填写验证码。登录后,采用session保持登录。
1.获取验证码地址
第一步:首先查看验证码对应的代码,可以从图中看到验证码图片的地址是:per.enetedu.com/Common/CreateImage?tmep_seq=1613623257608
颜色标红的部分tmep_seq=1613623257608,是为了解决浏览器缓存问题加的时间戳,因此真正的验证码图片地址是:per.enetedu.com/Common/CreateImage
第二步:找出登录时提交的表单内容和POST地址。
(1) 不填写用户名密码和验证码,直接点击登录,使用Chrome浏览器的Network检查,找到POST地址:per.enetedu.com/AdminIndex/LoginDo
(2) 继续向下看,找到提交的表单 Form Data。

