如何在Opencv和Tesseract中做出选择
如何在Opencv和Tesseract中做出选择我最近遇到了Tesseract和OpenCV。OpenCV可以用作创建OCR应用程序/服务的框架。
我的一些图像上使用Tesseract,效果也还可以。后来,我看到了一个关于使用OpenCV使用Python执行OCR 的非常简单的教程,之后,我实现了对系统的训练,其效果也还好。但是,当然,采取这种方法意味着我需要使用大型训练集广泛地训练我的系统。我的具体问题如下:
[*]如何选择Tesseract和使用OpenCV构建自定义的OCR应用程序?
[*]有针对不同语言的Tesseract可用的培训数据集。OpenCV有类似的东西,所以我不必为了实现OCR而着手开展工作吗?
[*]哪一个更适合想要成为商业应用?
Tesseract是一款OCR引擎。它被谷歌专门用于阅读文本,执行基本的文档分割以及对特定图像输入(单个单词,行,段落,页面,有限字典等)进行操作和使用。
另一方面,OpenCV是一个计算机视觉库,其中包含可让你执行一些特征提取和数据分类的功能。
如果你想对OCR的硬性有一个基本的了解,请尝试OpenCV。Tesseract是用于真正的 OCR。
页:
[1]