Python实习案例:敢挑战敢看系列反爬字体?深度解析那僧挖坑过程?
- 内容介绍
- 文章标签
- 相关推荐
本文共计700个文字,预计阅读时间需要3分钟。
@[toc]🔥 实习实战场景🏢 宿舍📝 本篇博客📚 继续学习:字体反爬虫🔍 涉及站点:- 实习+x- 目标站点地址🔗 直接百度搜索即可。
右侧源码中出现了许多乱码,其中包含关键信息。
@[toc]
⛳️ 实习 实战场景 僧
本篇博客继续学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。可以看到右侧源码中出现了很多“乱码”,这其中就包含了关键信息。
接下来按照常规的套路,在开发者工具中检索字体相关信息,但是筛选之后,并没有得到反爬的字体,只有一个 file? 有些许的可能性。这里就是一种新鲜的场景了,如果判断不准,那只能用字体样式和字体标签名进行判断了。在网页源码中检索 @font-face 和 myFont,得到下图内容,这里发现 file 字体又出现了,看来解决问题的关键已经出现了。
下载文件名之后发现无后缀名,我们可以补上一个 .ttf 的后缀,接下来拖拽到 FontCreator 中,然后进行查阅。二次刷新页面之后,再次获取一个 file 文件,查看二者是否有编码变化问题。
结论:每次请求字体文件,得到的响应无变化。
既然没有变化,后续的字体反爬实战编码就变的简单了。
⛳️ 实习 实战编码 僧
解析字体文件,获取编码与字符。
本文共计700个文字,预计阅读时间需要3分钟。
@[toc]🔥 实习实战场景🏢 宿舍📝 本篇博客📚 继续学习:字体反爬虫🔍 涉及站点:- 实习+x- 目标站点地址🔗 直接百度搜索即可。
右侧源码中出现了许多乱码,其中包含关键信息。
@[toc]
⛳️ 实习 实战场景 僧
本篇博客继续学习字体反爬,涉及的站点是实习 x,目标站点地址直接百度搜索即可。可以看到右侧源码中出现了很多“乱码”,这其中就包含了关键信息。
接下来按照常规的套路,在开发者工具中检索字体相关信息,但是筛选之后,并没有得到反爬的字体,只有一个 file? 有些许的可能性。这里就是一种新鲜的场景了,如果判断不准,那只能用字体样式和字体标签名进行判断了。在网页源码中检索 @font-face 和 myFont,得到下图内容,这里发现 file 字体又出现了,看来解决问题的关键已经出现了。
下载文件名之后发现无后缀名,我们可以补上一个 .ttf 的后缀,接下来拖拽到 FontCreator 中,然后进行查阅。二次刷新页面之后,再次获取一个 file 文件,查看二者是否有编码变化问题。
结论:每次请求字体文件,得到的响应无变化。
既然没有变化,后续的字体反爬实战编码就变的简单了。
⛳️ 实习 实战编码 僧
解析字体文件,获取编码与字符。

