Hello, Tensor World!
让我们来分析一下你刚才运行的 Hello World 的代码。代码如下:
import tensorflow as tf
# Create TensorFlow object called hello_constant
hello_constant = tf.constant('Hello World!')
with tf.Session() as sess:
# Run the tf.constant operation in the session
output = sess.run(hello_constant)
print(output)
Tensor
在 TensorFlow 中,数据不是以整数、浮点数或者字符串形式存储的。这些值被封装在一个叫做 tensor 的对象中。在 hello_constant = tf.constant('Hello World!')
代码中,hello_constant
是一个 0 维度的字符串 tensor,tensor 还有很多不同大小:
# A is a 0-dimensional int32 tensor
A = tf.constant(1234)
# B is a 1-dimensional int32 tensor
B = tf.constant([123,456,789])
# C is a 2-dimensional int32 tensor
C = tf.constant([ [123,456,789], [222,333,444] ])
tf.constant()
是你在本课中即将使用的多个 TensorFlow 运算之一。tf.constant()
返回的 tensor 是一个常量 tensor,因为这个 tensor 的值不会变。
Session
TensorFlow 的 api 构建在 computational graph 的概念上,它是一种对数学运算过程进行可视化的方法(在 MiniFlow 这节课中学过)。让我们把你刚才运行的 TensorFlow 代码变成一个图:
如上图所示,一个 "TensorFlow Session" 是用来运行图的环境。这个 session 负责分配 GPU(s) 和/或 CPU(s),包括远程计算机的运算。让我们看看如何使用它:
with tf.Session() as sess:
output = sess.run(hello_constant)
代码已经从之前的一行中创建了 tensor hello_constant
。接下来是在 session 里对 tensor 求值。
这段代码用 tf.Session
创建了一个 sess
的 session 实例。然后 sess.run()
函数对 tensor 求值,并返回结果。
输入
在上一小节中,你向 session 传入一个 tensor 并返回结果。如果你想使用一个非常量(non-constant)该怎么办?这就是 tf.placeholder()
和 feed_dict
派上用场的时候了。这一节将向你讲解向 TensorFlow 传输数据的基础知识。
tf.placeholder()
很遗憾,你不能把数据集赋值给 x
再将它传给 TensorFlow。因为之后你会想要你的 TensorFlow 模型对不同的数据集采用不同的参数。你需要的是 tf.placeholder()
!
数据经过 tf.session.run()
函数得到的值,由 tf.placeholder()
返回成一个 tensor,这样你可以在 session 运行之前,设置输入。
Session 的 feed_dict
x = tf.placeholder(tf.string)
with tf.Session() as sess:
output = sess.run(x, feed_dict={x: 'Hello World'})
用 tf.session.run()
里的 feed_dict
参数设置占位 tensor。上面的例子显示 tensor x
被设置成字符串 "Hello, world"
。如下所示,也可以用 feed_dict
设置多个 tensor。
x = tf.placeholder(tf.string)
y = tf.placeholder(tf.int32)
z = tf.placeholder(tf.float32)
with tf.Session() as sess:
output = sess.run(x, feed_dict={x: 'Test String', y: 123, z: 45.67})
注意:
如果传入 feed_dict
的数据与 tensor 类型不符,就无法被正确处理,你会得到 “ValueError: invalid literal for
...”。
练习
让我们看看你对 tf.placeholder()
和 feed_dict
的理解如何。下面的代码有一个报错,但是我想让你修复代码并使其返回数字 123
。修改第 11 行,使代码返回数字 123
。
# Solution is available in the other "solution.py" tab
import tensorflow as tf
def run():
output = None
x = tf.placeholder(tf.int32)
with tf.Session() as sess:
# TODO: Feed the x tensor 123
output = sess.run(x,feed_dict={x:123})
# print(output)
return output
TensorFlow 数学
获取输入很棒,但是现在你需要使用它。你将使用每个人都懂的基础数学运算,加、减、乘、除,来处理 tensor。(更多数学函数请查看文档)。
加法
x = tf.add(5, 2) # 7
从加法开始,tf.add()
函数如你所想,它传入两个数字、两个 tensor、或数字和 tensor 各一个,以 tensor 的形式返回它们的和。
减法和乘法
这是减法和乘法的例子:
x = tf.subtract(10, 4) # 6
y = tf.multiply(2, 5) # 10
x
tensor 求值结果是 6
,因为 10 - 4 = 6
。y
tensor 求值结果是 10
,因为 2 * 5 = 10
。是不是很简单!
类型转换
为了让特定运算能运行,有时会对类型进行转换。例如,你尝试下列代码,会报错:
tf.subtract(tf.constant(2.0),tf.constant(1)) # Fails with ValueError: Tensor conversion requested dtype float32 for Tensor with dtype int32:
这是因为常量 1 是整数,但是常量 2.0 是浮点数,subtract 需要它们的类型匹配。
在这种情况下,你可以确保数据都是同一类型,或者强制转换一个值为另一个类型。这里,我们可以把 2.0 转换成整数再相减,这样就能得出正确的结果:
tf.subtract(tf.cast(tf.constant(2.0), tf.int32), tf.constant(1)) # 1
练习
让我们应用所学到的内容,转换一个算法到 TensorFlow。下面是一段简单的用除和减的算法。把这个算法从 Python 转换到 TensorFlow 并把结果打印出来。你可以用 tf.constant()
来对 10
、2
和 1
赋值。
# Solution is available in the other "solution.py" tab
import tensorflow as tf
# TODO: Convert the following to TensorFlow:
x = tf.constant(10)
y = tf.constant(2)
z = tf.subtract(tf.divide(x,y),tf.cast(tf.constant(1),tf.float64))
# TODO: Print z from a session
with tf.Session() as sess:
output = sess.run(z)
print(output)