英文官方网站:
http://tensorflow.org/
官方GitHub仓库:
https://github.com/tensorflow/tensorflow
中文版 GitHub 仓库:
https://github.com/jikexueyuanwiki/tensorflow-z
二级制安装
TensorFlow Python API 依赖 Python 2.7 版本.
- 在 Linux下最简单的安装方式, 是使用pip 安装
Ubuntu/Linux
# 仅使用 CPU 的版本
$ pip install https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.5.0-cp27-none-linux_x86_64.whl
# 开启 GPU 支持的版本 (安装该版本的前提是已经安装了 CUDA sdk)
$ pip install https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.5.0-cp27-none-linux_x86_64.whl
补充:
pip 二进制包安装了开启 GPU 支持的 TensorFlow, 必须确保系统里安装了正确的 CUDA sdk 和CUDNN 版本.
还需要设置LD_LIBRARY_PATH 和CUDA_HOME 环境变量. 可以考虑将下面的命令 添加到~/.bash_profile文件中, 这样每次登陆后自动生效.
注意, 假定 CUDA 安装目录为/usr/local/cuda :
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64"
export CUDA_HOME=/usr/local/cuda
基于 Docker 的安装
我通过Docker 运行 TensorFlow. 不用操心软件依赖问题.
首先, 安装 Docker并启动启动运行, 启动一个容器:
$ docker run -it b.gcr.io/tensorflow/tensorflow #默认的Docker镜像只包含启动和运行TensorFlow所需依赖库的一个最小集.
额外提供了 下面的容器, 通过上述docker run 命令安装: b.gcr.io/tensorflow/tensorflow-full
注:镜像中的 TensorFlow 是从源代码完整安装的, 包含了编译和运行TensorFlow 所需的全部工具. 在该镜像上, 可以直接使用源代码进行实验, 而不需要再安装上述的任何依赖.
基于 VirtualEnv 的安装
推荐使用virtualenv 创建一个隔离的容器, 来安装 TensorFlow. 这样做能使排查安装问题变得更容易.
1、首先, 安装所有必备工具:
# 在 Linux 上:
$ sudo apt-get install python-pip python-dev python-virtualenv
2、建立一个全新的 virtualenv 环境. 为了将环境建在~/tensorflow 目录下, 执行:
$ virtualenv --system-site-packages ~/tensorflow
$ cd ~/tensorflow
3、 激活 virtualenv:
$ source bin/activate # 如果使用 bash
$ source bin/activate.csh # 如果使用 csh
(tensorflow)$ # 终端提示符应该发生变化
4、在 virtualenv 内, 安装 TensorFlow:
(tensorflow)$ pip install --upgrade <$url_to_binary.whl>
5、运行 TensorFlow 程序:
(tensorflow)$ cd tensorflow/models/image/mnist
(tensorflow)$ python convolutional.py
# 当使用完 TensorFlow
(tensorflow)$ deactivate # 停用 virtualenv
源码安装
1、克隆 TensorFlow 仓库
$ git clone --recurse-submodules https://github.com/tensorflow/tensorflow
--recurse-submodules 参数是必须的, 用于获取 TesorFlow 依赖的 protobuf 库.
2、Linux 安装
(1) 安装 Bazel :首先依照教程安装 Bazel 的依赖. 然后下载和编译 Bazel 的源码:
$ git clone https://github.com/bazelbuild/bazel.git
$ cd bazel
$ git checkout tags/0.1.0
$ ./compile.sh
注:命令中拉取的代码标签为0.1.0 , 兼容 Tensorflow 目前版本. bazel 的HEAD 版本 (即最新版本) 在这里可能不稳定.
将执行路径output/bazel 添加到$PATH 环境变量中.
(2) 安装其他依赖
$ sudo apt-get install python-numpy swig python-dev
可选: 安装 CUDA (在 Linux 上开启 GPU 支持)
为了编译并运行能够使用 GPU 的 TensorFlow, 需要先安装 NVIDIA 提供的 Cuda Toolkit 7.0 和 CUDNN 6.5 V2.
TensorFlow 的 GPU 特性只支持 NVidia Compute Capability >= 3.5 的显卡. 被支持的显卡 包括但不限于:
• NVidia Titan
• NVidia Titan X
• NVidia K20
• NVidia K40
(3)下载并安装 Cuda Toolkit 7.0
将工具安装到诸如/usr/local/cuda 之类的路径.
(4) 下载并安装 CUDNN Toolkit 6.5
解压并拷贝 CUDNN 文件到 Cuda Toolkit 7.0 安装路径下. 假设 Cuda Toolkit 7.0 安装 在/usr/local/cuda , 执行以下命令:
tar xvzf cudnn-6.5-linux-x64-v2.tgz
sudo cp cudnn-6.5-linux-x64-v2/cudnn.h /usr/local/cuda/include
sudo cp cudnn-6.5-linux-x64-v2/libcudnn* /usr/local/cuda/lib64
(5) 配置 TensorFlow 的 Cuba 选项
从源码树的根路径执行:
$ ./configure
Do you wish to bulid TensorFlow with GPU support? [y/n] y
GPU support will be enabled for TensorFlow
Please specify the location where CUDA 7.0 toolkit is installed. Refer to
README.md for more details. [default is: /usr/local/cuda]: /usr/local/cuda
Please specify the location where CUDNN 6.5 V2 library is installed. Refer to
README.md for more details. [default is: /usr/local/cuda]: /usr/local/cuda
Setting up Cuda include
Setting up Cuda lib64
Setting up Cuda bin
Setting up Cuda nvvm
Configuration finished
这些配置将建立到系统 Cuda 库的符号链接. 每当 Cuda 库的路径发生变更时, 必须重新执行上述 步骤, 否则无法调用 bazel 编译命令.
(6) 编译目标程序, 开启 GPU 支持
从源码树的根路径执行:
$ bazel build -c opt --config=cuda //tensorflow/cc:tutorials_example_trainer
$ bazel-bin/tensorflow/cc/tutorials_example_trainer --use_gpu
# 大量的输出信息. 这个例子用 GPU 迭代计算一个 2x2 矩阵的主特征值 (major eigenvalue).
# 最后几行输出和下面的信息类似.
000009/000005 lambda = 2.000000 x = [0.894427 -0.447214] y = [1.788854 -0.894427]
000006/000001 lambda = 2.000000 x = [0.894427 -0.447214] y = [1.788854 -0.894427]
000009/000009 lambda = 2.000000 x = [0.894427 -0.447214] y = [1.788854 -0.894427]
注意, GPU 支持需通过编译选项 "--config=cuda" 开启.
已知问题
• 尽管可以在同一个源码树下编译开启 Cuda 支持和禁用 Cuda 支持的版本, 我们还是推荐在切换这两种不同的编译配置时, 使用 "bazel clean" 清理环境.
• 在执行 bazel 编译前必须先运行 configure, 否则编译会失败并提示错误信息. 未来, 我们可能考虑将 configure 步骤包含在编译过程中, 以简化整个过程, 前提是 bazel 能够提供新的特性支持这样.
常见问题
GPU 相关问题
如果在尝试运行一个 TensorFlow 程序时出现以下错误:
ImportError: libcudart.so.7.0: cannot open shared object file: No such file or directory
请确认你正确安装了 GPU 支持;
在 Linux 上如果出现错误:
...
"__add__", "__radd__",
^
SyntaxError: invalid syntax
解决方案: 确认正在使用的 Python 版本为 Python 2.7.