如何用PHP的Curl实现携带Header请求头信息访问HTTP?
- 内容介绍
- 文章标签
- 相关推荐
本文共计518个文字,预计阅读时间需要3分钟。
导读:curl请求时添加请求头信息,可以模拟真人操作,不易被识别为爬虫(采集),从而绕过Incapsula等安全验证机制。以下是具体步骤:
1. 使用浏览器(例如火狐浏览器)访问目标网站。
2.打开开发者工具,找到网络标签页。
3.在网络标签页中,找到要访问的页面请求,点击查看。
4.在请求的头部信息中,添加以下内容:
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3
这条User-Agent信息可以模拟一个真实的浏览器环境。
5. 点击发送按钮,请求网站数据。
通过以上步骤,curl请求将带有真实的请求头信息,模拟真人操作,减少被识别为爬虫的风险。
导读:
curl请求时添加请求头信息可以模拟真人操作,不容易被当成是爬虫机器人(采集),从而可以绕过Incapsula等安全验证机制。
1、首先使用浏览器(示例使用的是火狐浏览器)访问接口网址,使用F12调试,查看请求头信息,如下:
2、实现代码:
<?php /** * 开始访问请求 * @param $url * @return bool|string */ function fetch_url($url) { $header = FormatHeader($url); $useragent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0'; $timeout= 120; $ch = curl_init($url); curl_setopt($ch, CURLOPT_FAILONERROR, true); //设置请求头信息 curl_setopt($ch, CURLOPT_HTTPHEADER, $header); //不取得返回头信息 curl_setopt($ch, CURLOPT_HEADER, 0); // 关闭{$temp['host']}/", "Content-Type: text/xml; charset=utf-8", 'Accept: application/json, text/javascript, */*; q=0.01', 'Accept-Encoding:gzip, deflate, br', 'Accept-Language:zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2', 'Connection:keep-alive', 'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0', 'X-Requested-With: XMLHttpRequest', ); return $header; } ?>
3、调用示例:
<?php //lcg_value() 返回范围为 (0, 1) 的一个伪随机数 $url="www.xxx.com/getdata.php?v=".lcg_value(); //访问网址 $html = fetch_url($url);
到此这篇关于php的curl携带header请求头信息实现http访问的方法的文章就介绍到这了,更多相关php的curl请求头信息实现http访问内容请搜索自由互联以前的文章或继续浏览下面的相关文章希望大家以后多多支持自由互联!
本文共计518个文字,预计阅读时间需要3分钟。
导读:curl请求时添加请求头信息,可以模拟真人操作,不易被识别为爬虫(采集),从而绕过Incapsula等安全验证机制。以下是具体步骤:
1. 使用浏览器(例如火狐浏览器)访问目标网站。
2.打开开发者工具,找到网络标签页。
3.在网络标签页中,找到要访问的页面请求,点击查看。
4.在请求的头部信息中,添加以下内容:
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3
这条User-Agent信息可以模拟一个真实的浏览器环境。
5. 点击发送按钮,请求网站数据。
通过以上步骤,curl请求将带有真实的请求头信息,模拟真人操作,减少被识别为爬虫的风险。
导读:
curl请求时添加请求头信息可以模拟真人操作,不容易被当成是爬虫机器人(采集),从而可以绕过Incapsula等安全验证机制。
1、首先使用浏览器(示例使用的是火狐浏览器)访问接口网址,使用F12调试,查看请求头信息,如下:
2、实现代码:
<?php /** * 开始访问请求 * @param $url * @return bool|string */ function fetch_url($url) { $header = FormatHeader($url); $useragent = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0'; $timeout= 120; $ch = curl_init($url); curl_setopt($ch, CURLOPT_FAILONERROR, true); //设置请求头信息 curl_setopt($ch, CURLOPT_HTTPHEADER, $header); //不取得返回头信息 curl_setopt($ch, CURLOPT_HEADER, 0); // 关闭{$temp['host']}/", "Content-Type: text/xml; charset=utf-8", 'Accept: application/json, text/javascript, */*; q=0.01', 'Accept-Encoding:gzip, deflate, br', 'Accept-Language:zh-CN,zh;q=0.8,zh-TW;q=0.7,zh-HK;q=0.5,en-US;q=0.3,en;q=0.2', 'Connection:keep-alive', 'User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:83.0) Gecko/20100101 Firefox/83.0', 'X-Requested-With: XMLHttpRequest', ); return $header; } ?>
3、调用示例:
<?php //lcg_value() 返回范围为 (0, 1) 的一个伪随机数 $url="www.xxx.com/getdata.php?v=".lcg_value(); //访问网址 $html = fetch_url($url);
到此这篇关于php的curl携带header请求头信息实现http访问的方法的文章就介绍到这了,更多相关php的curl请求头信息实现http访问内容请搜索自由互联以前的文章或继续浏览下面的相关文章希望大家以后多多支持自由互联!

