这是我用到的一个github模型
LayoutlMv: 将表单进行结构化处理的预训练模型。利用ocr提取表单中图片信息,transformer对文字和表格信息进行统一处理
模型连接:https://github.com/microsoft/unilm/blob/master/layoutlmft/README.md
我是按照模型提示的步骤进行操作,到pip install -r requirements.txt出现了问题。原因是我们有配深度学习的环境。
接下来是正确的步骤
Step1:配C++的环境
- 下载Microsoft visula studio 2019
因为windows没有c++的编辑器,所以必须下载
- 下载MinGW
Step2:配深度学习的环境
1. 下载minicaonda,在conda里面配环境
2.下载cuda11.1
是.exe程序文件,直接双击安装
3.下载与cuda11.1相匹配的cuDNN版本
4.下载与cuda11.1对应的pytorch1.8的版本
tips:pytorch命令行安装,时间较长,耐心等待
Step2:bug解决
- 将detectron克隆到本地之后,detectron2安装不成功;python setup.py build develop
这一句一直出问题 - 缺少底层编译器如microsoft visual studio 和 MinGW
detectron2的安装步骤:
参考1:https://detectron2.readthedocs.io/en/latest/tutorials/install.html
参考2:https://github.com/conansherry/detectron2
问题1: " NVIDIA GPU computing toolkit\CUDA\v11.1\bin\nvcc.exe" failed with exit code 1 的解决方案参考连接
问题2:中间有一个问题是pytorch的版本问题。我安装的是pytorch1.7结果提示>= pytorch1.8才行。然后就是把上面的深度学习环境重新配了一遍
问题3:怎么将detectron2=0.6版本改成detectron2=0.3
我的做法是从这个连接下载 detectron2=0.3 的包,替换之前下载的detectron2=0.6,然后执行detectron的安装 就成功了
python setup.py build develop
detectron2的所有版本: