如何通过py-spy工具有效诊断并解决scrapy爬虫卡顿问题?
- 内容介绍
- 文章标签
- 相关推荐
本文共计627个文字,预计阅读时间需要3分钟。
背景:在使用Scrapy爬取东西时,通过crontab定时启动爬虫,但发现机器上经常产生很多卡死的Scrapy进程。
内容:一段时间内,大量进程卡死,导致有10几个进程都卡死在那,并且会导致数据产出问题。
背景
在使用scrapy爬取东西的时候,使用crontab定时的启动爬虫,但是发现机器上经常产生很多卡死的scrapy进程,一段时间不管的话,会导致有10几个进程都卡死在那,并且会导致数据产出延迟。
问题定位
使用py-spy这个非常好用的python性能分析工具来进行排查,py-spy可以查看一个python进程函数调用用时,类似unix下的top命令。所以我们用这个工具看看是什么函数一直在执行。
本文共计627个文字,预计阅读时间需要3分钟。
背景:在使用Scrapy爬取东西时,通过crontab定时启动爬虫,但发现机器上经常产生很多卡死的Scrapy进程。
内容:一段时间内,大量进程卡死,导致有10几个进程都卡死在那,并且会导致数据产出问题。
背景
在使用scrapy爬取东西的时候,使用crontab定时的启动爬虫,但是发现机器上经常产生很多卡死的scrapy进程,一段时间不管的话,会导致有10几个进程都卡死在那,并且会导致数据产出延迟。
问题定位
使用py-spy这个非常好用的python性能分析工具来进行排查,py-spy可以查看一个python进程函数调用用时,类似unix下的top命令。所以我们用这个工具看看是什么函数一直在执行。

