当前基于OCR技术的产品提供的能力:
- 文字识别,格式比较规整的文本扫描,比如一段纯文本文字,名片(一般名片应用是对名片格式模板做了大量适配才会比较好);往深的发展可以识别图片或视频上的文字。
- 图片内容自动裁剪,说白了就是帮助用户把用手机拍照片的主要内容裁剪出来,其输出还是图片。
OCR技术在K12教育的应用情况:
- 搜题出答案,本质是对拍照的题进行特征识别,然后从数据库找到该特征类似的题目,其技术不是简单通过识别文字然后查找,而是有复杂算法。
- 标准模板的纸质试卷的自动批改,举例科大讯飞提供一个服务,就是按照一定格式制作试卷(各科都可以),学生答题后,用专门扫描仪扫描试卷就可以统计成绩。(本质的答题卡的扩展)。
- 文本内容识别+英文语法规则实现英文作文的自动批改。举例,科大讯飞页提供该服务。与上一条一样,本质是要减少老师批改作业工作量和老师分析学生成绩的工作量。
- 学习笔记、作业、试卷的保存与分享,本质是通过OCR减低用户保存、裁剪、分享文件的工作量,比如拍身份证,拍学霸的学习笔记、拍合同文件等等,只要想保存某些内容都可以拍下来。(但这应该场景本质是图片的加工处理,不是文字识别)
K12教育产品可以通过OCR技术做什么?初步分析如下:
- 识别手写打分。老师作业批改,涉及老师在pad给作业打分,老师可以用手写笔批改和打分,通过OCR技术自己识别分数,而不需要使用数字键盘输入分数,让老师使用过程比较流畅。(但感觉这个功能只能算有价值,但不是很高价值)
- 记录内容。拍照裁剪保存学习内容是学生常用功能,所以我们可以在我们产品集成这个功能,比如学霸自己把笔记拍摄下来,然后放到商城让其他学校的学生购买。
- 拍照搜题。该技术和题目量有一定门槛,建议找已有方案的公司合作。
- 内容批量电子化。该技术与拍照搜题类似,都是对题目内容进行拍照,拍照搜题在于根据拍摄的内容特征到数据库找题目,而内容电子化是把大的内容片段切分成小片段,然后再通过文本识别技术和一定题目格式识别,把小片段内容电子化,最终实现纸质内容电子化。 这个技术也有比较大的难度,实现起来不简单。