一、安装步骤
-
双击
tesseract-ocr-w64-setup-5.3.4.20240503.exe
安装包,点击ok
-
点击【Next】
-
点击【I Agree】
-
点击【Next】
-
选择安装组件
- 展开【Additional language data】
- 勾选 【Math / equation detection module】和 【Chinese(Simplified)】
- 点击 【Next】
-
选择安装路径
-
点击【Install】
-
点击【Next】
-
点击【Finish】
-
新建系统变量,变量名为:
TESSERACT_HOME
,变量值为刚刚选择的安装路径
-
编辑环境变量(
Path
),新建,并填写:%TESSRACT_HOME%
安装完成
在一张待识别图片的目录下,打开command窗口,执行:
tesseract 七镜主页.jpg 图像转文字结果 -l chi_sim
- tesseract:工具名
-
七镜主页.jpg
:图像名 -
图像转文字结果
:指定输出转换结果的的txt文件名 -
-l chi_sim
:指定识别语言为简体中文
- 打开
图像转文字结果.txt
可以看到识别结果,不是特别完美,不过基本上够用了,毕竟一般还要做二次加工的。