工作中,我们经常会遇到需要复制PDF文档、或者图片中大段文字的需求。通常的办法只能老老实实的一个字一个字的手动打出来,但是这种方法效率极低,打字快的话还可以接受,最多落个手酸而已,如果打字比较慢的话这种方式简直不可忍受。不过,利用图片文字识别技术,我们可以轻松的解决这种烦恼。接下来就让我们来看一下比较常用的几种图文识别的方式吧!
方式一:通过tesseract-ocr识别
注意:该方法需要对有一定的计算机基础,不建议小白使用。
Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎,可以识别多种格式的图像文件并将其转换成文本,目前已支持60多种语言(包括中文)。
下载地址
具体的安装过程网上一大堆,这里就不重复介绍了。
使用很简单,在命令行输入tesseract input.png result -l chi_sim
,其中input.png
是你需要识别的图片,result
指定识别结果的文件名,-l chi_sim
指定使用中文识别。程序执行结束之后,再当前文件夹会有一个result.txt
文件,即为识别结果。
可以看到,识别的结果还是可以的。
方式二:通过百度AI图文识别接口识别
注意:该方法需要有少量的编程基础,不建议小白使用。
百度AI开放平台
点击上方链接,进入百度AI开放平台,然后点击右上角控制台进入百度智能云-管理中心,需要登录,没有账号的话注册一个账号。
点击左侧导航的文字识别,创建应用。
创建成功之后,进入应用列表,获取
AppID
、API Key
、Secret Key
,调用API需要使用这三个参数。接下来,我们需要安装一下百度的SDK
pip install baidu-aip
,安装好之后就可以开始coding了,直接上代码:
from tkinter import *
import tkinter.filedialog
from os import path
from aip import AipOcr
# 百度OCR AppID API Key Secret Key
APP_ID = '**'
API_KEY = '**'
SECRECT_KEY = '**'
#利用百度api识别文本,并保存提取的文字
def baiduOCR(picfile):
filename = path.basename(picfile)
client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)
i = open(picfile, 'rb')
img = i.read()
#message = client.basicGeneral(img) # 通用文字识别,每天 50000 次免费
message = client.basicAccurate(img) # 通用文字高精度识别,每天 800 次免费
i.close()
# 获取文本内容
result = []
for text in message.get('words_result'):
result.append(text.get('words') + '\n')
return result
def chooseFile():
picfile = tkinter.filedialog.askopenfilename(
initialdir='C',
title='选择图片',
filetypes=(("所有图片", ("*.jpg", "*.jpeg", "*.png")), ('All file', '*.*')))
if picfile != '':
label.config(text="开始文字识别处理...")
words = baiduOCR(picfile)
for word in words:
text.insert("insert",word)
label.config(text="图片文本提取结束!")
else:
label.config(text="您未选择文件!")
if __name__ == '__main__':
root = Tk()
root.title("图片文本提取")
root.geometry("400x220")
label = Label(root, text='')
label.pack()
button = Button(root, text='图片识别文字提取', command=chooseFile)
button.pack()
text = Text(root, width=45, height=10)
text.pack(pady=5)
root.mainloop()
运行程序,测试一下识别效果:
嗯,识别的是比方式一强了许多。
方式三:通过钉钉的拍图识字功能识别
简单易用,推荐。
操作很简单,准备好要识别的图片,发送到手机钉钉,打开文档的拍图识字功能选择图片识别后复制出文字即可。
综上来看,使用钉钉是最简单的方式了,唯一不方便之处在于只支持手机版App,但瑕不掩瑜,推荐大家使用该方式。