【你一定用的上】利用图片文字识别技术轻松解决复制粘贴文本困扰

工作中，我们经常会遇到需要复制PDF文档、或者图片中大段文字的需求。通常的办法只能老老实实的一个字一个字的手动打出来，但是这种方法效率极低，打字快的话还可以接受，最多落个手酸而已，如果打字比较慢的话这种方式简直不可忍受。不过，利用图片文字识别技术，我们可以轻松的解决这种烦恼。接下来就让我们来看一下比较常用的几种图文识别的方式吧！

方式一：通过tesseract-ocr识别

注意：该方法需要对有一定的计算机基础，不建议小白使用。

Tesseract是一个开源的OCR（Optical Character Recognition，光学字符识别）引擎，可以识别多种格式的图像文件并将其转换成文本，目前已支持60多种语言（包括中文）。

下载地址
具体的安装过程网上一大堆，这里就不重复介绍了。
使用很简单，在命令行输入tesseract input.png result -l chi_sim，其中input.png是你需要识别的图片，result指定识别结果的文件名，-l chi_sim指定使用中文识别。程序执行结束之后，再当前文件夹会有一个result.txt文件，即为识别结果。

输入图片.png

识别结果.png

可以看到，识别的结果还是可以的。

方式二：通过百度AI图文识别接口识别

注意：该方法需要有少量的编程基础，不建议小白使用。
百度AI开放平台
点击上方链接，进入百度AI开放平台，然后点击右上角控制台进入百度智能云-管理中心，需要登录，没有账号的话注册一个账号。

image.png

点击左侧导航的文字识别，创建应用。

image.png

创建成功之后，进入应用列表，获取AppID、API Key、Secret Key，调用API需要使用这三个参数。

image.png

接下来，我们需要安装一下百度的SDK pip install baidu-aip，安装好之后就可以开始coding了，直接上代码：

from tkinter import *
import tkinter.filedialog
from os import path
from aip import AipOcr

# 百度OCR AppID  API Key  Secret Key
APP_ID = '**'
API_KEY = '**'
SECRECT_KEY = '**'

#利用百度api识别文本，并保存提取的文字
def baiduOCR(picfile):
    filename = path.basename(picfile)
    client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)
    i = open(picfile, 'rb')
    img = i.read()
    #message = client.basicGeneral(img)  # 通用文字识别，每天 50000 次免费
    message = client.basicAccurate(img)  # 通用文字高精度识别，每天 800 次免费
    i.close()
    # 获取文本内容
    result = []
    for text in message.get('words_result'):
        result.append(text.get('words') + '\n')
    return result  


def chooseFile():
    picfile = tkinter.filedialog.askopenfilename(
        initialdir='C',
        title='选择图片',
        filetypes=(("所有图片", ("*.jpg", "*.jpeg", "*.png")), ('All file', '*.*')))
    if picfile != '':
        label.config(text="开始文字识别处理...")
        words = baiduOCR(picfile)
        for word in words:
            text.insert("insert",word)
        label.config(text="图片文本提取结束！")
    else:
        label.config(text="您未选择文件！")

if __name__ == '__main__':
    root = Tk()
    root.title("图片文本提取")
    root.geometry("400x220")
    label = Label(root, text='')
    label.pack()
    button = Button(root, text='图片识别文字提取', command=chooseFile)
    button.pack()
    text = Text(root, width=45, height=10)
    text.pack(pady=5)
    root.mainloop()

运行程序，测试一下识别效果：

[图片上传中...(文字识别截图.png-45fade-1600836208610-0)]

文字识别截图.png

嗯，识别的是比方式一强了许多。

方式三：通过钉钉的拍图识字功能识别

简单易用，推荐。
操作很简单，准备好要识别的图片，发送到手机钉钉，打开文档的拍图识字功能选择图片识别后复制出文字即可。

截图.png

识别结果.png

综上来看，使用钉钉是最简单的方式了，唯一不方便之处在于只支持手机版App，但瑕不掩瑜，推荐大家使用该方式。

最后编辑于：2020.09.23 14:31:12