如何用Python Tesseract-OCR进行图片文字识别?(适合初学者)

2026-05-21 21:062阅读0评论SEO问题
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计300个文字,预计阅读时间需要2分钟。

如何用Python Tesseract-OCR进行图片文字识别?(适合初学者)

1. 首先准备环境: - Python版本:2.7/3.6 - 操作系统:Windows系统 - 准备工具:Tesseract-OCR,安装后配置好环境变量,链接:[下载链接](https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw),提取码:2med - 安装Pycharm,并安装相关Python包。

1.首先准备环境:

python版本:2.7/3.6

操作系统:windows系统

2.准备工具:

tesseract-ocr 安装后设置好环境变量

链接: pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med

如何用Python Tesseract-OCR进行图片文字识别?(适合初学者)

Pycharm

3.安装相关python包(作者使用的是py3.6)

pip install Pillow

pip install pytesseract

4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:

修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'

5.pycharm中程序运行

from PIL import Image
import pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径,路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)

注意图片为当前目录

完成!


本文共计300个文字,预计阅读时间需要2分钟。

如何用Python Tesseract-OCR进行图片文字识别?(适合初学者)

1. 首先准备环境: - Python版本:2.7/3.6 - 操作系统:Windows系统 - 准备工具:Tesseract-OCR,安装后配置好环境变量,链接:[下载链接](https://pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw),提取码:2med - 安装Pycharm,并安装相关Python包。

1.首先准备环境:

python版本:2.7/3.6

操作系统:windows系统

2.准备工具:

tesseract-ocr 安装后设置好环境变量

链接: pan.baidu.com/s/1j8lBbQBrrbPaHAn5ujWFSw 提取码: 2med

如何用Python Tesseract-OCR进行图片文字识别?(适合初学者)

Pycharm

3.安装相关python包(作者使用的是py3.6)

pip install Pillow

pip install pytesseract

4.使tesseract-ocr与python关联,从而使python能够调用Tesseract-OCR程序识别验证码/文字:

修改pytesseract.py文件中第35行将tesseract_cmd指向Tesseract-OCR的tesseract.exe
我的是

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'D:/Tesseract/Tesseract-OCR/tesseract.exe'

5.pycharm中程序运行

from PIL import Image
import pytesseract
image = Image.open('1.png')#输入自己想识别图片的路径
# 指定路径,路径为安装的OCR对应的目录
text = pytesseract.image_to_string(image,) #如果安装了中文包逗号后可加参数 lang='chi_sim',
print(text)

注意图片为当前目录

完成!