如何使用pexpect库编写Python脚本自动抓取长尾词日志信息?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1199个文字,预计阅读时间需要5分钟。
1. 前言:对大部分的人来说,解决Bug都依赖于关键字去定位问题!在调试情况下,我们可以在控制台实时查看日志;但对于部署到服务器的应用,日志则存储在服务器某个目录中。
1. 前言
对大部分的人来说,解决 Bug 都是依靠关键字去日志去定位问题!
在调试情况下,我们可以实时在控制台查看日志;但对于部署到服务器上的应用,日志都存放在服务器某个目录下,没法通过本地查看到
这种情况下,就需要我们先登录服务器,然后进入到日志目录文件夹,最后通过日志文件去定位问题;如果涉及到 K8s 容器,可能还需要使用 kubectl 命令进入到服务对应的容器中,进入到日志目录,才能开始定位问题,这一切显得非常繁琐且低效
本篇文章介绍一款 Python 依赖库:pexpect,作为一款命令行自动化工具,它可以帮助我们一键获取日志,快速定位问题!
2. pexpect 介绍
pexpect 是 Python 语言实现的类Expect 的一种实现,通过产生子应用程序并控制它们,通过期望模式对子应用程序的输出做出相应处理
项目地址:
github.com/pexpect/pexpect/tree/5eed1a31a2853a09b7367c59fbd1a4a0b53341df
它主要对人机对话进行模拟,来实现一些自动化的场景
比如:用来和SSH、FTP、PASSWD、Telnet等命令行程序进行自动化交互
在使用之前,我们先安装依赖包
#安装依赖库 pip3installpexpect
3. 实战一下
我们以从服务器 K8S 容器获取日志为例进行讲解
3-1SSH 登录
首先,初始化使用 pexpect 模拟 SSH 远程登录服务器
importpexpect PROMPT=['#','>>>','>','\$'] deflogin_with_pexpect(): """ 登录-pexpect :return: """ #端口号 port=** #用户名 user=** #密码 pwd=** #ip地址 ip=** ssh_cmd="ssh-p{}{}@{}".format(port,user,ip) #指定登录命令,拿到程序操作句柄 child=pexpect.spawn(ssh_cmd,timeout=60,encoding='utf-8') #提示输入密码的字符出现,否则超时 ret=child.expect([pexpect.TIMEOUT,'[P|p]assword:'],timeout=10) #匹配成功后,输入密码,执行登陆操作 ifret==1: #发送密码 child.sendline(pwd) child.expect(PROMPT) returnchild else: print('登录失败!')
其中
pexpect.spawn() :用于执行一个程序,并返回一个操作句柄
该方法常见的 3 个参数如下:
- 第一个参数是待执行的命令
- 第二个参数指定超时时间,程序执行后的输出检查,如果指定时间内没有匹配到结果,就会抛异常
- 第三个参数用于设置编码格式
child.expect():对输出结果,利用正则表达式进行关键字匹配
代码中的含义是在 10s 内等待出现关键字'[P|p]assword:'
最后,如果匹配的结果为 1,使用sendline() 方法发送带回车符的字符串,模拟密码的输入,完成登录操作
3-2封装发送命令
接下来,我们将操作句柄发送命令进行一次封装,并获取返回结果
defsend_command(child,cmd,expected_content=None,timeout=10): """ 发送一条命令,并打印结果 :paramexpected_content: :paramchild: :paramcmd: :return: """ #发送一条命令 ifexpected_contentisNone: expected_content=["#"] child.sendline(cmd) #期望有命令行提示字符出现 child.expect(expected_content,timeout=timeout) #将之前的内容都输出 result=child.before returnresult
需要指出的是,child.before 用于获取到匹配到关键字为止,缓存里面已有的全部数据
3-3 进入容器 pod 日志目录
使用上面的方法,通过kubectl 进入到对应的容器日志目录
#登录pod容器 exec_enter_pod='kubectl-n%sexec-it%sbash'%(env,pod_name) #进入容器 send_command(child,exec_enter_pod) #进入到日志目录 send_command(child,"cdlogs",expected_content='tomcat/logs#')
3-4获取日志内容
最后我们只需要组成获取日志的命令
比如:使用grep/tail命令组成一个提取日志文件的命令
然后使用句柄对象发送这条命令
最后,对返回内容进行清洗即可
4. 最后
文中使用 pexpect实现了一个非常简单的场景
事实上,大部分人机对话自动化交互都可以由它来实现,比如,下载日志、实时配置、远程打包下载等
以上就是python基于pexpect库自动获取日志信息的详细内容,更多关于python pexpect库自动获取日志的资料请关注易盾网络其它相关文章!
本文共计1199个文字,预计阅读时间需要5分钟。
1. 前言:对大部分的人来说,解决Bug都依赖于关键字去定位问题!在调试情况下,我们可以在控制台实时查看日志;但对于部署到服务器的应用,日志则存储在服务器某个目录中。
1. 前言
对大部分的人来说,解决 Bug 都是依靠关键字去日志去定位问题!
在调试情况下,我们可以实时在控制台查看日志;但对于部署到服务器上的应用,日志都存放在服务器某个目录下,没法通过本地查看到
这种情况下,就需要我们先登录服务器,然后进入到日志目录文件夹,最后通过日志文件去定位问题;如果涉及到 K8s 容器,可能还需要使用 kubectl 命令进入到服务对应的容器中,进入到日志目录,才能开始定位问题,这一切显得非常繁琐且低效
本篇文章介绍一款 Python 依赖库:pexpect,作为一款命令行自动化工具,它可以帮助我们一键获取日志,快速定位问题!
2. pexpect 介绍
pexpect 是 Python 语言实现的类Expect 的一种实现,通过产生子应用程序并控制它们,通过期望模式对子应用程序的输出做出相应处理
项目地址:
github.com/pexpect/pexpect/tree/5eed1a31a2853a09b7367c59fbd1a4a0b53341df
它主要对人机对话进行模拟,来实现一些自动化的场景
比如:用来和SSH、FTP、PASSWD、Telnet等命令行程序进行自动化交互
在使用之前,我们先安装依赖包
#安装依赖库 pip3installpexpect
3. 实战一下
我们以从服务器 K8S 容器获取日志为例进行讲解
3-1SSH 登录
首先,初始化使用 pexpect 模拟 SSH 远程登录服务器
importpexpect PROMPT=['#','>>>','>','\$'] deflogin_with_pexpect(): """ 登录-pexpect :return: """ #端口号 port=** #用户名 user=** #密码 pwd=** #ip地址 ip=** ssh_cmd="ssh-p{}{}@{}".format(port,user,ip) #指定登录命令,拿到程序操作句柄 child=pexpect.spawn(ssh_cmd,timeout=60,encoding='utf-8') #提示输入密码的字符出现,否则超时 ret=child.expect([pexpect.TIMEOUT,'[P|p]assword:'],timeout=10) #匹配成功后,输入密码,执行登陆操作 ifret==1: #发送密码 child.sendline(pwd) child.expect(PROMPT) returnchild else: print('登录失败!')
其中
pexpect.spawn() :用于执行一个程序,并返回一个操作句柄
该方法常见的 3 个参数如下:
- 第一个参数是待执行的命令
- 第二个参数指定超时时间,程序执行后的输出检查,如果指定时间内没有匹配到结果,就会抛异常
- 第三个参数用于设置编码格式
child.expect():对输出结果,利用正则表达式进行关键字匹配
代码中的含义是在 10s 内等待出现关键字'[P|p]assword:'
最后,如果匹配的结果为 1,使用sendline() 方法发送带回车符的字符串,模拟密码的输入,完成登录操作
3-2封装发送命令
接下来,我们将操作句柄发送命令进行一次封装,并获取返回结果
defsend_command(child,cmd,expected_content=None,timeout=10): """ 发送一条命令,并打印结果 :paramexpected_content: :paramchild: :paramcmd: :return: """ #发送一条命令 ifexpected_contentisNone: expected_content=["#"] child.sendline(cmd) #期望有命令行提示字符出现 child.expect(expected_content,timeout=timeout) #将之前的内容都输出 result=child.before returnresult
需要指出的是,child.before 用于获取到匹配到关键字为止,缓存里面已有的全部数据
3-3 进入容器 pod 日志目录
使用上面的方法,通过kubectl 进入到对应的容器日志目录
#登录pod容器 exec_enter_pod='kubectl-n%sexec-it%sbash'%(env,pod_name) #进入容器 send_command(child,exec_enter_pod) #进入到日志目录 send_command(child,"cdlogs",expected_content='tomcat/logs#')
3-4获取日志内容
最后我们只需要组成获取日志的命令
比如:使用grep/tail命令组成一个提取日志文件的命令
然后使用句柄对象发送这条命令
最后,对返回内容进行清洗即可
4. 最后
文中使用 pexpect实现了一个非常简单的场景
事实上,大部分人机对话自动化交互都可以由它来实现,比如,下载日志、实时配置、远程打包下载等
以上就是python基于pexpect库自动获取日志信息的详细内容,更多关于python pexpect库自动获取日志的资料请关注易盾网络其它相关文章!

