Python爬虫中如何实现JS代码逆向分析?
- 内容介绍
- 文章标签
- 相关推荐
本文共计818个文字,预计阅读时间需要4分钟。
Python爬虫中JS逆向案例,由于在爬取数据时遇到请求头限制特性,动态生成。解决方案整理如下:
JS逆向有两种思路:
一种是将js文件整体整理出js代码,在Python中直接使用execjs调用js文件(可见)。
Python爬虫之JS逆向案例
由于在爬取数据时,遇到请求头限制属性为动态生成,现将解决方式整理如下:
JS逆向有两种思路:
一种是整理出js文件在Python中直接使用execjs调用js文件(可见我的另一篇文章《python爬虫之企某科技JS逆向》)。
一种是根据JS中的逻辑,使用Python重写相应的方法。
本文介绍的是第二种使用Python重写JS的方法
需求:爬取某区块链网站www.oklink.com/zh-cn/btc/tx-list?limit=20&pageNum=1数据
遇到的问题:目标网站的数据是通过ajax请求相应的接口获取数据,在请求头中需要携带x-apiKey(根据时间动态生成的),我们需要解决的就是整理出动态生成x-apiKey的方法。
本文共计818个文字,预计阅读时间需要4分钟。
Python爬虫中JS逆向案例,由于在爬取数据时遇到请求头限制特性,动态生成。解决方案整理如下:
JS逆向有两种思路:
一种是将js文件整体整理出js代码,在Python中直接使用execjs调用js文件(可见)。
Python爬虫之JS逆向案例
由于在爬取数据时,遇到请求头限制属性为动态生成,现将解决方式整理如下:
JS逆向有两种思路:
一种是整理出js文件在Python中直接使用execjs调用js文件(可见我的另一篇文章《python爬虫之企某科技JS逆向》)。
一种是根据JS中的逻辑,使用Python重写相应的方法。
本文介绍的是第二种使用Python重写JS的方法
需求:爬取某区块链网站www.oklink.com/zh-cn/btc/tx-list?limit=20&pageNum=1数据
遇到的问题:目标网站的数据是通过ajax请求相应的接口获取数据,在请求头中需要携带x-apiKey(根据时间动态生成的),我们需要解决的就是整理出动态生成x-apiKey的方法。

