TensorFlow 安装与环境配置

TensorFlow 安装与环境配置 https://tf.wiki/zh/basic/installation.html


  • TensorFlow 版本(请检查 TensorFlow 版本为 2.0 及以上)
import tensorflow as tf
print (tf.__version__)
  • 完整的最小可运行程序代码(建议将代码在 IDE 中运行而不是交互式环境)
  • 完整的报错信息(Traceback)

1,如何确定 gpu 是否比 cpu 快还是慢。
譬如 i7 和 gtx 1050 ,有必要安装 gpu 版本吗?
2,是否是要么是 cpu 来计算 要么是 gpu 来计算。要对比的话是否两个版本都要装?

  1. 可以分别使用 GPU 和 CPU 运行同一个模型来选择合适的运算设备。GPU 和 CPU 的选择与模型类型也有关系,例如如果是卷积神经网络则 gtx1050 可能胜过 i7,但如果是强化学习则不一定。

  2. 可以简单地认为,是的。不需要两个版本都装,TensorFlow 2.1 默认安装(pip install tensorflow)就已经同时支持 CPU 和 GPU,可以使用

    cpus = tf.config.list_physical_devices (device_type=‘CPU’)
    tf.config.set_visible_devices (devices=cpus)

来限定只使用 CPU 进行运算。

1、tf.config.set_visible_devices (devices=cpus) 设定似乎有问题,搜索了 Tf2 官方,也没看明白这个用法。

2、一种方法,类似于当前程序的全局设定,放在 import tensorflow 之前
import os
os.environ [“CUDA_DEVICE_ORDER”] = “PCI_BUS_ID”
os.environ [“CUDA_VISIBLE_DEVICES”] = “-1”

with tf.device (’/cpu:0’):
A = tf.constant ([[1, 2], [3, 4]])
B = tf.constant ([[5, 6], [7, 8]])
C = tf.matmul (A, B)
print ©

with tf.device (’/gpu:0’):
A = tf.constant ([[1, 2], [3, 4]])
B = tf.constant ([[5, 6], [7, 8]])
C = tf.matmul (A, B)
print ©

可以参考 tf.config.set_visible_devices  |  TensorFlow v2.14.0 ,相关内容在 https://tf.wiki/zh/basic/tools.html#tf-config-gpu 也有介绍。一个简单的示例程序如下:

import tensorflow as tf
tf.debugging.set_log_device_placement (True)     # 设置输出运算所在的设备

cpus = tf.config.list_physical_devices ('CPU')   # 获取当前设备的 CPU 列表
tf.config.set_visible_devices (cpus)             # 设置 TensorFlow 的可见设备范围为 cpu

A = tf.constant ([[1, 2], [3, 4]])
B = tf.constant ([[5, 6], [7, 8]])
C = tf.matmul (A, B)

print (C)


2020-04-21 11:37:29.007897: I tensorflow/core/common_runtime/eager/execute.cc:573] Executing op MatMul in device /job:localhost/replica:0/task:0/device:CPU:0
tf.Tensor (
[[19 22]
[43 50]], shape=(2, 2), dtype=int32)

当然最保险的办法是新开一个 conda 虚拟环境并且

pip install tensorflow-cpu

,安装仅支持 CPU 的 TensorFlow 版本。

请问安装 cuda 时为什么会报错:(‘Connection broken: OSError ("(10054, ‘WSAECONNRESET’)")’, OSError ("(10054, ‘WSAECONNRESET’)"))

看起来可能是网络问题。如果使用 conda 安装的话建议设置镜像。

When I use pip install tensorflow
I got the feedback:
ERROR: Could not find a version that satisfies the requirement tensorflow (from versions: none)
ERROR: No matching distribution found for tensorflow
But I find the command worked:
python -m pip install --upgrade https://storage.googleapis.com/tensorflow/mac/cpu/tensorflow-0.12.0-py3-none-any.whl
If you meet such a question, you can try it.

你这个 TensorFlow 的版本也太老啦。本教程面向 TensorFlow 2.1,如果 pip install tensorflow 出现错误(这种情况一般很少见),请检查 Python 环境设置,重新建立一个新的 conda 环境再安装,或者在搜索引擎里搜索一下报错内容。

安装一直出错是因为我之前下了 Python3.7.4-32bit 版本,换成了 64bit 就没有问题了

关于 IDE 设置 的,我的路径是 /opt/anaconda3/envs/tf2/bin/python ,不知道会不会有问题……。我系统是 macOS 10.15.3 (19D76)


你好,按照这种方式在 Anaconda 环境中使用 TF2.1 会遇到在使用 Tensorboard 的 Profile 时报错的问题,报错如下:

2020-05-08 11:09:24.374761: W tensorflow/stream_executor/platform/default/dso_loader.cc:55] Could not load dynamic library 'libcupti.so.10.1'; dlerror: libcupti.so.10.1: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: /opt/gridview//pbs/dispatcher/lib::/usr/local/lib64:/usr/local/lib
2020-05-08 11:09:24.374801: E tensorflow/core/profiler/internal/gpu/cupti_tracer.cc:1307] function cupti_interface_->Subscribe ( &subscriber_, (CUpti_CallbackFunc) ApiCallback, this) failed with error CUPTI could not be loaded or symbol could not be found.
2020-05-08 11:09:24.374816: E tensorflow/core/profiler/internal/gpu/cupti_tracer.cc:1346] function cupti_interface_->ActivityRegisterCallbacks ( AllocCuptiActivityBuffer, FreeCuptiActivityBuffer) failed with error CUPTI could not be loaded or symbol could not be found.

另附 nvidia-smi 和 conda list 的结果:

参考一下 python - Tensorflow CUDA - CUPTI error: CUPTI could not be loaded or symbol could not be found - Stack Overflow

ERROR: Could not find a version that satisfies the requirement tensorflow (from versions: none)
ERROR: No matching distribution found for tensorflow

按你说的装不了 tensorflow

请检查你的 Python 版本是否为 64 位,参考 https://stackoverflow.com/questions/48720833/could-not-find-a-version-that-satisfies-the-requirement-tensorflow

您好!我安装的 tf 2.0,每次启动时,cuda 的加载信息如下,有的信息重复显示了两次,但是计算上没有问题,请问您知道是什么原因吗?
<tf.Tensor: id=0, shape=(), dtype=int32, numpy=1>

同问,安装完 tensorflow2.2,也是一样的,但是输出过程正常

@MingCheung @hifeng2017 TensorFlow 在运行过程中会在终端打一些 log,这个是正常的,具体使用上只要不报错就行(有 warning 的话大多是使用了过时的 api,可以根据提示做一些调整)

如果不喜欢这些 log,可以参考 https://stackoverflow.com/questions/35911252/disable-tensorflow-debugging-information 把 log 关掉。