当前访客身份:游客 [ 登录 | 加入开源中国 ]
当前访客身份: 游客 [ 登录 | 加入开源中国 ]
雪人 雪人
擦。
博客分类
最新评论
访客统计
  • 0
  • 15
  • 23
  • 270
  • 15105

Centos5.5 安装Tesseract-OCR

发表于4年前(2012-02-15 17:23)   阅读(3471) | 评论(15 0人收藏此文章,
1

[听云 Python探针公测]送瑞士军刀背包 送雷蛇键鼠套装!  


安装Tesseract-OCR 
准备工作:
编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)
yum install gcc gcc-c++ make

依赖的包: autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel leptonica(1.67以上)

1. autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:
yum install autoconf automake libtool
yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
2. leptonica 需要源码编译安装
参考资料:
http://paramountideas.com/tesseract-ocr-30-and-leptonica-installation-centos-55-and-opensuse-113
http://www.leptonica.org/source/README.html
下载 leptonica 包: http://www.leptonica.org/source/leptonica-1.68.tar.gz
解压后切换到 leptonica-1.68 根目录
./configure
make
make install
tesseract安装:
依赖安装完毕后开始安装tesseract
下载 tesseract-3.01 安装包: http://tesseract-ocr.googlecode.com/files/tesseract-3.01.tar.gz
解压后切换到 tesseract-3.01 根目录
(如果在make时遇到类似 strngs.h:1: error: stray '\357' in program 的错误,请将 tesseract-3.01/ccutil/strngs.h 文件转为 ANSI 编码保存,再重新编译)
./autogen.sh
./configure
make
make install
ldconfig
tesseract英文语言包安装:
下载 tesseract-3.01 英文语言包: http://tesseract-ocr.googlecode.com/files/tesseract-ocr-3.01.eng.tar.gz
解压后将 tesseract-ocr/tessdata 下的所有文件全部拷贝到 /usr/local/share/tessdata 下
安装完毕.
测试一下:
切换到解压后的 tesseract-3.01 根目录(这个目录下有一个自带的 phototest.tif 可以做测试用)
命令行:
tesseract phototest.tif phototest -l eng

输出:
Tesseract Open Source OCR Engine v3.01 with Leptonica
Page 0

这时应该在当前目录生成一个 phototest.txt 文本文件,内容就是 phototest.tif 显示的文字.

分享到: 1
声明:OSCHINA 博客文章版权属于作者,受法律保护。未经作者同意不得转载。

评论

雪人

插入: 表情 开源软件

关闭插入表情