Java实现PDF文字内容识别，结合OCR实现PDF图片实现-CFANZ编程社区

Java实现PDF文字内容识别，结合OCR实现PDF图片实现

（操作系统是centos7）

hostname //查看主机名
vim /etc/hostname //将里面的主机名更改为master
vim /etc/hosts  //将127.0.0.1后面的主机名更改为master，在后面加入一行IP地址与主机名之间的映射
reboot //重启服务器

systemctl stop firewalld //关闭防火墙
systemctl disable firewalld //禁用防火墙服务（永久关闭）
firewall-cmd --state //查看防火墙状态

(hadoop、jdk文件链接：https://pan.baidu.com/s/1wal1CSF1oO2h4dkSbceODg 提取码：4zra)

mkdir /usr/data //创建data文件
mkdir /usr/apps //创建apps文件

 tar -zxf jdk-8u201-linux-x64.tar.gz -C /usr/apps/

[root@master apps]# cd ./jdk1.8.0_201/ 
[root@master jdk1.8.0_201]# pwd 
/usr/apps/jdk1.8.0_201  //拿到jdk的路径
[root@master jdk1.8.0_201]#

vim 编辑/etc/profile文件

添加下列语句（赋值时不要有空格，图中有空格）

export JAVA_HOME=/usr/apps/jdk1.8.0_201
export PATH=$PATH:$JAVA_HOME/bin

保存退出。

source /etc/profile //重新加载该文件
java -version //查看jdk版本，检查环境是否设置成功

tar -zxvf hadoop-2.7.1.tar.gz -C /usr/apps/  //-zxvf可以打印解压的东西

[root@master data]# cd /usr/apps/hadoop-2.7.1/

[root@master hadoop-2.7.1]# cd /etc/hadoop

[root@master hadoop]# vim hadoop-env.sh

（四个文件全部在hadoop-2.7.1/etc/hadoop/目录下，vim编辑即可）

（更改/etc/profile后，需重新加载，source /etc/profile）

[root@master hadoop-2.7.1]# hadoop namenode -format

[root@master hadoop-2.7.1]# sbin/start-dfs.sh

0 条评论