如何使用Python爬虫中的PhantomJS实例方法加载网页?
- 内容介绍
- 相关推荐
本文共计379个文字,预计阅读时间需要2分钟。
PhantomJS是获取网页的常用工具之一,我们已介绍过页面测试、代码评估和屏幕抓取等使用方式。最危险的是网页的抓取问题,这里不再赘述。今天我们要讲的是它的新功能。
PhantomJS作为常用获取页面的工具之一,我们已经讲过页面测试、代码评估和捕获屏幕这几种使用的方式。当然最厉害的还是网页方面的捕捉,这里就不再讲述了。今天我们要讲的是它加载页面的新方法,这个可能很多人不知道。其实经常会用到,感兴趣的小伙伴一起进入今天的学习之中吧~
可以利用 phantom 来实现页面的加载,下面的例子实现了页面的加载并将页面保存为一张图片。
var page = require('webpage').create();
page.open('cuiqingcai.com', function (status) {
console.log("Status: " + status);
if (status === "success") {
page.render('example.png');
}
phantom.exit();
});
首先创建了一个 webpage 对象,然后加载本站点主页,判断响应状态,如果成功,那么保存截图为 example.png 以上代码命名为 pageload.js,命令行
phantomjspageload.js
发现执行成功,然后目录下多了一张图片,example.png
因为这个 render 方法,phantom 经常会用到网页截图的功能。
本文共计379个文字,预计阅读时间需要2分钟。
PhantomJS是获取网页的常用工具之一,我们已介绍过页面测试、代码评估和屏幕抓取等使用方式。最危险的是网页的抓取问题,这里不再赘述。今天我们要讲的是它的新功能。
PhantomJS作为常用获取页面的工具之一,我们已经讲过页面测试、代码评估和捕获屏幕这几种使用的方式。当然最厉害的还是网页方面的捕捉,这里就不再讲述了。今天我们要讲的是它加载页面的新方法,这个可能很多人不知道。其实经常会用到,感兴趣的小伙伴一起进入今天的学习之中吧~
可以利用 phantom 来实现页面的加载,下面的例子实现了页面的加载并将页面保存为一张图片。
var page = require('webpage').create();
page.open('cuiqingcai.com', function (status) {
console.log("Status: " + status);
if (status === "success") {
page.render('example.png');
}
phantom.exit();
});
首先创建了一个 webpage 对象,然后加载本站点主页,判断响应状态,如果成功,那么保存截图为 example.png 以上代码命名为 pageload.js,命令行
phantomjspageload.js
发现执行成功,然后目录下多了一张图片,example.png
因为这个 render 方法,phantom 经常会用到网页截图的功能。

