Ubuntu上跑通PaddleOCR网站首页 学无止境

Ubuntu上跑通PaddleOCR

Ki1381 2023-06-03 00:00:03

简介Ubuntu上跑通PaddleOCR

书接上文。刚才说到我已经在NUC8里灌上了Windows Server 2019。接下来也顺利的启用了Hyper-V角色并装好了一台Ubuntu 22.04 LTS 的虚机。由于自从上回在树莓派上跑通了Paddle-Lite-Demo之后想再研究一下PaddleOCR但进展不顺，因此决定先不折腾了，还是从x64平台上做起，至少先能跑通体验一下。

进入Ubuntu，先做常规更新工作：
sudo apt update
sudo apt upgrade

安装一些远程工具。建议ssh装上：
sudo apt install xrdp ssh

其它实用工具，建议smbclient装上：
sudo apt install git smbclient

给$PATH添加一条路径，推荐这会儿先做掉：
cd
sudo nano ./.bashrc
最后添加一行：
export PATH=/home/ki/.local/bin:$PATH
sudo reboot

至此准备工作完毕，接下来开始安装PaddleOCR相关的软件：

sudo apt install cmake libopencv-dev python3-pip 
python3 -m pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple
python3 -m pip install paddleocr -i https://pypi.tuna.tsinghua.edu.cn/simple

期间可能有个报错，版本依赖有问题，暂时可以忽略。

至此就算安装完毕可以测试了。

我的测试用例有一个图片和一个pdf。我是在Ubuntu上用smbclient命令访问Windows上共享目录得到的。在Windows上运行WinSCP也是个可行的办法。

先看看图片的识别效果：

命令行为：paddleocr --image_dir 图片文件名 --lang ch。lang参数指出用什么语言去解读。ch是指中英文。第一次运行时会下载一些必要的模型。

识别正确。

PDF识别稍微有点小问题，要改一下源代码。命令行和识别图片几乎一致，PDF的文件名也是通过 --image_dir 参数提供。另外也可以加 --page_num 参数用于指定识别的页码，不写的话识别全部文档。

但会报错。解决办法也很简单粗暴，根据提示直接改就是了。后面还有一处同性质的错误，懒得贴图，这里直接一并给出了。一共两处。

之后就可以运行了。不妨对比下原始pdf和识别出的效果：

识别率满意。

最后，如果实在介意那个版本依赖造成的错，有人说可以这么操作算是打个补丁：

pip uninstall onnx
python3 -m pip install protobuf==3.20.1 -i https://pypi.tuna.tsinghua.edu.cn/simple
python3 -m pip install onnx==1.12.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

尚未亲测，仅供参考。

====^^^^====
测过了，没用，但似乎也没影响。

风语者！平时喜欢研究各种技术，目前在从事后端开发工作，热爱生活、热爱工作。