大众在点评遭遇字体反爬技术,落地解决方案堪称一绝?
- 内容介绍
- 文章标签
- 相关推荐
本文共计497个文字,预计阅读时间需要2分钟。
@[toc] 📚 大众实战场景 + 点评 + 本次要点:学习网站也是比较大众的网站,这个站点中遇到了【套娃】字体加密。+ 开发者工具刷新站点,可获取如下字体系列文件请求。
@[toc]
⛳️ 大众 实战场景 点评
本次要用来学习的站点也是比较大众的站点,这个站点中碰到了字体加密。
打开开发者工具刷新站点,可以得到如下字体文件请求,打开开发者工具碰到无限 debugger,取消掉即可。
文字所在标签添加的样式如下所示。然后顺着这个思路进行下去,得到了 4 层字体套娃。而该 CSS 文件,在页面中竟然每次刷新也发生变化。
⛳️ 大众 实战场景 点评
编写页面获取代码,得到文件。
import requests from lxml import etree headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36", "HOST": "www.dianping.com" } res = requests.get('www.dianping.com/shijiazhuang/ch10',headers=headers) tree = etree.HTML(res.text) print(tree.xpath('//link/@href')[8])得到 CSS 文件之后,在截取其中的字体文件。
这里不在过多解析,查阅一下字体文件每次刷新,是否发生编码变化。
本文共计497个文字,预计阅读时间需要2分钟。
@[toc] 📚 大众实战场景 + 点评 + 本次要点:学习网站也是比较大众的网站,这个站点中遇到了【套娃】字体加密。+ 开发者工具刷新站点,可获取如下字体系列文件请求。
@[toc]
⛳️ 大众 实战场景 点评
本次要用来学习的站点也是比较大众的站点,这个站点中碰到了字体加密。
打开开发者工具刷新站点,可以得到如下字体文件请求,打开开发者工具碰到无限 debugger,取消掉即可。
文字所在标签添加的样式如下所示。然后顺着这个思路进行下去,得到了 4 层字体套娃。而该 CSS 文件,在页面中竟然每次刷新也发生变化。
⛳️ 大众 实战场景 点评
编写页面获取代码,得到文件。
import requests from lxml import etree headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.54 Safari/537.36", "HOST": "www.dianping.com" } res = requests.get('www.dianping.com/shijiazhuang/ch10',headers=headers) tree = etree.HTML(res.text) print(tree.xpath('//link/@href')[8])得到 CSS 文件之后,在截取其中的字体文件。
这里不在过多解析,查阅一下字体文件每次刷新,是否发生编码变化。

