一、添加层add_layer
在 Tensorflow 里定义一个添加层的函数可以很容易的添加神经层,为之后的添加省下不少时间。神经层里常见的参数通常有weights、biases和激励函数。
定义添加神经层的函数def add_layer(),它有四个参数:输入值、输入的大小、输出的大小和激励函数,我们设定默认的激励函数是None。
def add_layer(inputs, in_size, out_size, activation_function=None):
接下来是weights和biases。
因为在生成初始参数时,随机变量(normal distribution)会比全部为0要好很多,所以我们这里的weights为一个in_size行, out_size列的随机变量矩阵。
Weights = tf.Variable(tf.random_normal([in_size, out_size]))
在机器学习中,biases的推荐值不为0,所以我们这里是在0向量的基础上又加了0.1。
biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
下面,我们定义xW_plus_b, 即神经网络未激活的值。其中,tf.matmul()是矩阵的乘法。
xW_plus_b= tf.matmul(inputs, Weights) + biases
当activation_function——激励函数为None时,输出就是当前的预测值——xW_plus_b,不为None时,就把Wx_plus_b传到activation_function()函数中得到输出。
if activation_function is None:
outputs = xW_plus_b
else:
outputs = activation_function(xW_plus_b)
return outputs
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-1-add-layer/
二、建造神经网络
- 导入数据
这里的x_data和y_data并不是严格的一元二次函数的关系,因为我们多加了一个noise,这样看起来会更像真实情况。
x_data = np.linspace(-1,1,300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise
利用占位符定义我们所需的神经网络的输入。 tf.placeholder()就是代表占位符,这里的None代表无论输入有多少都可以,因为输入只有一个特征,所以这里是1。
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])
接下来就可以开始定义神经层了。 通常神经层都包括输入层、隐藏层和输出层。这里的输入层只有一个属性, 所以我们就只有一个输入;隐藏层我们可以自己假设,这里我们假设隐藏层有10个神经元; 输出层和输入层的结构是一样的,所以我们的输出层也是只有一层。 所以,我们构建的是——输入层1个、隐藏层10个、输出层1个的神经网络。
利用之前的add_layer()函数定义隐藏层,这里使用 Tensorflow 自带的激励函数tf.nn.relu。
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu)
接着,定义输出层。此时的输入就是隐藏层的输出——l1,输入有10个神经元(隐藏层的输出层),输出有1个神经元。
prediction = add_layer(l1, 10, 1, activation_function=None)
计算预测值prediction和真实值的误差,对二者差的平方取平均。
loss = tf.reduce_mean(tf.square(ys - prediction),
reduction_indices=[1])
接下来,是很关键的一步,如何让机器学习提升它的准确率。tf.train.GradientDescentOptimizer()中的值通常都小于1,这里取的是0.1,代表以0.1的效率来最小化误差loss。
train_step = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
定义Session,并用 Session 来执行初始化步骤。 (注意:在tensorflow中,只有session.run()才会执行我们定义的运算。)
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to see the step improvement
print(sess.run(loss, feed_dict={xs: x_data, ys: y_data}))
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-2-create-NN/
三、结果可视化
构建图形,用散点图描述真实数据之间的关系。 (注意:这里是直接在前面的基础上写的代码,需要from matplot import pyplot as plt,plt.ion()表示开启交互模式,用于连续显示。)
# plot the real data
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(x_data, y_data)
plt.ion() #本次运行请注释,全局运行不要注释
plt.show()
接下来,我们来显示预测数据。每隔50次训练刷新一次图形,用红色、宽度为5的线来显示我们的预测数据和输入之间的关系,并暂停0.1s。
for i in range(1000):
# training
sess.run(train_step, feed_dict={xs: x_data, ys: y_data})
if i % 50 == 0:
# to visualize the result and improvement
try:
ax.lines.remove(lines[0])
except Exception:
pass
prediction_value = sess.run(prediction, feed_dict={xs: x_data})
# plot the prediction
lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
plt.pause(0.1)
参考链接:https://morvanzhou.github.io/tutorials/machine-learning/tensorflow/3-3-visualize-result/
四、优化器
Tensorflow 中的优化器会有很多不同的种类。最基本, 也是最常用的一种就是GradientDescentOptimizer。一般比较常用的是MomentumOptimizer和AdamOptimizer。另外,Alpha Go使用的优化器是RMSPropOptimizer。