今天在改进 iText 中的段落识别。回顾了一下这几天大家反馈的关于段落识别的问题,发现在既有的算法上调整,还挺麻烦。另一方面,既然对段落识别有了更深的认识,索性推拿重来好了。
毕竟,对于同样调用在线 OCR 服务的产品而言,段落识别等优化,都是程序技术的核心。在这方面多花点时间钻研,是值得的。
不过,发现停顿开发做推广几天后,再来搞这部分,竟有些吃力了。看来,代码不能停啊。
博客原文:1203 - 段落识别算法,推倒重来
今天在改进 iText 中的段落识别。回顾了一下这几天大家反馈的关于段落识别的问题,发现在既有的算法上调整,还挺麻烦。另一方面,既然对段落识别有了更深的认识,索性推拿重来好了。
毕竟,对于同样调用在线 OCR 服务的产品而言,段落识别等优化,都是程序技术的核心。在这方面多花点时间钻研,是值得的。
不过,发现停顿开发做推广几天后,再来搞这部分,竟有些吃力了。看来,代码不能停啊。
博客原文:1203 - 段落识别算法,推倒重来