安装/使用 tesseract

安装

git clone --branch 4.0.0-beta.1 https://github.com/tesseract-ocr/tesseract.git

#安装tesseract-ocr编译依赖
yum install autoconf automake autoconf-archive libtool -y
#安装图像解析包  可以自己搭配格式
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel -y
#安装图像处理与图像分析工具,tesseract依赖于它
wget http://www.leptonica.org/source/leptonica-1.71.tar.gz 
./configure  
make  
make install  


#准备安装tesseract-ocr
./autogen.sh  
./configure  
make  
make install  
ldconfig

使用

#tesseract简单使用
[root@VM_14_141_centos reignTools]# tesseract template.jpg a
上述标识在可以正常使用tesseract的前提下 在当前目录下有template.jpg文件一个,对改图像文件进行解析 结果响应到a文件内

tesseract imagename outputbase [-l lang] [-psm pagesegmode] [configfile...]
1.imagename是你要识别的图片的名字,不需要打引号,直接输入即可。
2.outputbase是输出结果文件的名字,不需要文件类型后缀,就是txt,这个参数就是txt的文件名。
3.lang是语言代码,默认英语,如果要识别中文,则:
  tesseract template.jpg a -l chi_sim
  若同时识别中英文,则使用+进行连接  
  tesseract template.jpg a -l chi_sim+eng
4.pagesegmode则用来匹配使用哪种识别模式
  正常键入tesseract会打印
    0  = Orientation and script detection (OSD) only.
    1  = Automatic page segmentation with OSD.
    2  = Automatic page segmentation, but no OSD, or OCR
    3  = Fully automatic page segmentation, but no OSD. (Default)
    4  = Assume a single column of text of variable sizes.
    5  = Assume a single uniform block of vertically aligned text.
    6  = Assume a single uniform block of text.
    7  = Treat the image as a single text line.
    8  = Treat the image as a single word.
    9  = Treat the image as a single word in a circle.
    10 = Treat the image as a single character.
    0 定向脚本监测(OSD)
    1 使用OSD自动分页
    2 自动分页,但是不使用OSD或OCR(Optical Character Recognition,光学字符识别)
    3 全自动分页,但是没有使用OSD(默认)
    4 假设可变大小的一个文本列。
    5 假设垂直对齐文本的单个统一块。
    6 假设一个统一的文本块。
    7 将图像视为单个文本行。
    8 将图像视为单个词。
    9 将图像视为圆中的单个词。
    10 将图像视为单个字符。


问题

java使用tess4j时在win环境可能会出现

 - java.lang.UnsatisfiedLinkError: 找不到指定的模块

的问题,主要原因是在Windows环境下,gsdll64.dll,liblept170.dll,libtesseract304.dll等三个文件是通过vc2013编译的。

点击此处进行安装。

Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception [Handler dispatch failed; nested exception is java.lang.UnsatisfiedLinkError: Unable to load library 'tesseract': Native library (linux-x86-64/libtesseract.so) not found in resource path ([jar:file:/project/reignTools/reign

原因:没有配置LD_LIBRARY_PATH=/usr/local/lib:$PATH,配置前要find下libtesseract.so是否存在(linux)

./configure: line 4193: syntax error near unexpected token -mavx,' ./configure: line 4193:AX_CHECK_COMPILE_FLAG(-mavx, avx=true, avx=false)'

原因:缺少autoconf-archive

若安装成功tesseract后,可以通过
locate xxx.so查找是否存在动态链接库文件。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 7,283评论 0 10
  • afinalAfinal是一个android的ioc,orm框架 https://github.com/yangf...
    wgl0419阅读 6,263评论 1 9
  • Spring Web MVC Spring Web MVC 是包含在 Spring 框架中的 Web 框架,建立于...
    Hsinwong阅读 22,301评论 1 92
  • 曾有人无数次的问我你这么来荒废你的青春难道不后悔吗,想着他们各种各样的语气,表情,我的心就会不时的抽搐一下,...
    惘以然阅读 263评论 1 1
  • 年前回家的火车上,看了一本小说,名字叫《怦然心动》。 小说讲的是一对小孩,一棵树,特别简单的故事,但却很丰富。小说...
    GuangHui阅读 309评论 0 1