机器学习-Tensorflow

一下子看完这个网址不用跳跳跳点点点系列
学习链接：莫烦tensorflow

为什么选Tensorflow

什么是TensorFlow?
TensorFlow是Google开发的一款神经网络的Python外部的结构包, 也是一个采用数据流图来进行数值计算的开源软件库.TensorFlow 让我们可以先绘制计算结构图, 也可以称是一系列可人机交互的计算操作, 然后把编辑好的Python文件转换成更高效的C++, 并在后端进行计算.
为什么要使用TensorFlow?
TensorFlow 无可厚非地能被认定为神经网络中最好用的库之一. 它擅长的任务就是训练深度神经网络.通过使用TensorFlow我们就可以快速的入门神经网络, 大大降低了深度学习（也就是深度神经网络）的开发成本和开发难度. TensorFlow 的开源性, 让所有人都能使用并且维护, 巩固它. 使它能迅速更新, 提升.
BUG？
貌似Tensorflow有bug，虽然谷歌开发人员在尽力修改。。bug主要集中在他的选参数上面~

Tensorflow 安装

安装之前，推荐两个在线使用tensorflow的软件：
https://colab.research.google.com/
我的配置为win10, python3.6.4, ana

image.png

估摸着TensorFlow 的安装包目前windows版本还不支持 Python 3.6 ，于是到https://pypi.python.org/pypi/tensorflow/1.1.0rc2下载了whl文件，结果：

image.png

换成pip3还是不行：

image.png

看了网上的很多解决方案，好像还是安装Anaconda稍微显得简单一点。
安装好Anaconda后，我想检验一下，结果：

image.png

用'path'一看，环境变量没配：

image.png

由于安装的时候这一栏这么提示：

image.png

所以选择手动添加path。
添加3个变量：
F:\Anaconda3
F:\Anaconda3\Scripts
F:\Anaconda3\Library\bin
重启命令行：

image.png

成功！
由于我安装的最新版本的Anaconda,适用于python3.7,所以我还要设成3.6
输入命令：'conda install python=3.6'
安装结束后，输入：'anaconda search -t conda tensorflow'，搜索当前可用版本
选择一个版本输入：'anaconda show （对应名称）' ，查询安装命令
输入跳出的安装命令安装

Tensorflow基础架构

TensorFlow是采用数据流图（data　flow　graphs）来计算。
首先创建数据流流图，然后将数据（以张量——tensor的形式存在）放在数据流中计算。
节点（nodes）表示数学操作，线（edges）表示节点间相互联系的多维数组，即张量（tensor）。训练模型时，tensor会不断从数据流图中的一个结点流(flow)到另一个节点。即是tensor~~flow
张量
0阶：一个数值，比如'[1]'
1阶：向量，比如'[1,2,3]'
2阶：矩阵，比如'[[1,2], [1,2]]'
以此类推...感觉就是n阶矩阵...

如何搭建结构

import tensorflow as tf
import numpy as np

# 创建数据
x_data = np.random.rand(100).astype(np.float32)
y_data = x_data*0.1+0.3

# 搭建模型
weights = tf.Variable(tf.random_uniform([1], -1.0, 1.0))
biases = tf.Variable(tf.zeros([1]))

y = weights*x_data + biases

# 计算误差
loss = tf.reduce_mean(tf.square(y-y_data))

# 传播误差
optimizer = tf.train.GradientDescentOptimizer(0.5)
train = optimizer.minimize(loss)

#训练
init = tf.global_variables_initializer()  #初始化之前定义的所有Variable

sess = tf.Session()
sess.run(init)

for step in range(201):
    sess.run(train)
    if step % 20 == 0:
        print(step.sess.run(weights), sess.run(biases))

Session
目的：控制、输出文件执行的语句
运行'session.run()'可以获得运算结果

import tensorflow as tf

#创建两个矩阵
matrix = tf.constant([[3,3]])
matrix = tf.constant([[2],[2]])
product = tf.matmul(matrix1, matrix2) #输出矩阵相乘结果

#因为 product 不是直接计算的步骤
#所以我们会要使用 Session 来激活 product 并得到计算结果.

#方法1
sess = tf.Session()
result = sess.run(product)
print("method1:",result)
sess.close()

#方法2
with tf.Session() as sess:
    result2 = sess.run(product)
    print("method2:",result2)

Placeholder
目的：占位符，暂时存储变量。
如果想要从外部传入data, 那就需要用tf.placeholder(), 然后以这种形式传输数据 sess.run(***, feed_dict={input: **})

import tensorflow as tf

#定义两个输入
input1 = tf.placeholder(tf.float32)
input2 = tf.placeholder(tf.float32)

#做乘法运算，并输出为output
output = tf.multiply(input1, input2)

with tf.Session() as sess:
    print(sess.run(output, feed_dict={input1:[7.], input2:[2.]}))

激励函数
目的：矩阵相乘是线性相乘，激励函数可以将线性转化为非线性，事实上就是套一个非线性函数。

添加层 add_layer
目的：定义添加层函数可以添加一个神经层

import tensorflow as tf

#四个参数：输入值、输入的大小、输出的大小和激励函数
#设定默认的激励函数是None
def add_layer(inputs, in_size, out_size, activation_function=None):
    #weights为一个in_size行, out_size列的随机变量矩阵
    weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    #定义Wx_plus_b, 即神经网络未激活的值
    Wx_plus_b = tf.matmul(inputs, weights) + biases

    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return outputs

建造神经网络

import tensorflow as tf
import numpy as n

#添加一个神经层函数
def add_layer(inputs, in_size, out_size, activation_function=None):
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return output

#导入数据
x_data = np.linspace(-1, 1, 300, dtype=np.float32)[:, np.newaxis]
noise = np.random.normal(0, 0.05, x_data.shape).astype(np.float32)
y_data = np.square(x_data) - 0.5 + noise

#利用占位符tf.placeholder()定义我们所需的神经网络的输入
xs = tf.placeholder(tf.float32, [None, 1])
ys = tf.placeholder(tf.float32, [None, 1])

#构建网络
#输入层1个、隐藏层10个、输出层1个的神经网络

#定义隐藏层
l1 = add_layer(xs, 1, 10, activation_function=tf.nn.relu) #tf.nn.relu是自带的激励函数
#定义输出层
prediction = add_layer(l1, 10, 1, activation_function=None)
#计算prediction和真实值的均方差
loss = tf.reduce_mean(tf.reduce_sum(tf.square(ys-prediction),reduction_indices=[1]))

train_step = tf.train.GradientDencentOptimizer(0.1).minimize(loss)

init = tf.global_variables_initializer()

sess = tf.Session()
sess.run(init)#在tensorflow中，只有session.run()才会执行我们定义的运算。

#训练
for i in range(1000):
    sess.run(train_step, feed_dict={xs:x_data,ys:y_data})
    #每隔50次训练刷新一次图形，用红色、宽度为5的线来显示我们的预测数据和输入之间的关系，并暂停0.1s
    if i%50 == 0:
        try:
            ax.lines.remove(lines[0])
        except Exception:
            pass
        prediction_value = sess.run(prediction, feed_dict={xs: x_data})
        # plot the prediction
        lines = ax.plot(x_data, prediction_value, 'r-', lw=5)
        plt.pause(0.1)

加速神经网络
*方法1：Stochastic Gradient Descent (SGD) 随机梯度下降：随机也就是只取可以近似所有的样本的一个例子，这样大大减少了时间。（有点像TransE算法中的负采样）
*方法2：Momentum 更新方法
由于SGD很随机，其更新十分不稳定。因此momentum在更新的时候在一定程度上保留之前更新的方向，同时利用当前batch的梯度微调最终的更新方向。这样一来，可以在一定程度上增加稳定性，从而学习地更快，并且还有一定摆脱局部最优的能力。
其实也就是说，假如我上次走的路是对的，那么我接着往前走，并且微调一下前进的方向，向着更准确的方向进行。
*方法三：AdaGrad 更新方法：使得每一个参数更新都会有自己与众不同的学习率。
*方法四：RMSProp 更新方法：momentum+adagrad
*方法五：Adam 更新方法：Adam 算法根据损失函数对每个参数的梯度的一阶矩估计和二阶矩估计动态调整针对于每个参数的学习速率。Adam 也是基于梯度下降的方法，但是每次迭代参数的学习步长都有一个确定的范围，不会因为很大的梯度导致很大的学习步长，参数的值比较稳定。

用Tensorboard可视化神经网络

注：与 tensorboard 兼容的浏览器是 “Google Chrome”
这部分不想学了。

高阶内容

Classification 分类学习

from tensorflow.examples.tutorials.mnist import input_data

#准备数据（MNIST库，MNIST库是手写体数字库, 需要翻墙）
#数据中包含55000张训练图片，每张图片的分辨率是28×28
#所以我们的训练网络输入应该是28×28=784个像素数据
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

#添加一个神经层函数
def add_layer(inputs, in_size, out_size, activation_function=None):
    Weights = tf.Variable(tf.random_normal([in_size, out_size]))
    biases = tf.Variable(tf.zeros([1, out_size]) + 0.1)
    Wx_plus_b = tf.matmul(inputs, Weights) + biases
    if activation_function is None:
        outputs = Wx_plus_b
    else:
        outputs = activation_function(Wx_plus_b)
    return output

#搭建网络
xs = tf.placeholder(tf.float32, [None,784])
ys = tf.placeholder(tf.float32,[None,10])

#输入数据是784个特征，输出数据是10个特征，激励采用softmax函数
prediction = add_layer(xs, 784, 10, activation_function=tf.nn.softmax)

#loss函数（即最优化目标函数）选用交叉熵函数。
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1])) # loss

#train方法（最优化算法）采用梯度下降法
train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)
sess = tf.Session()
sess.run(tf.global_variables_initializer())

#训练
batch_xs, batch_ys = mnist.train.next_batch(100)
sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys})
#每训练50次输出一下预测精度
if i % 50 == 0:
    print(compute_accuracy(mnist.test.images, mnist.test.labels))

过拟合
解释：做物理实验的时候不是要描点画线嘛，通常最后是一条直线。但是数据经过网络后变成了弯弯曲曲的曲线，虽然过每一个点，但是并不正确。这种情况就是过拟合。

最后编辑于：2018.11.24 21:46:35

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 195,783评论 5赞 462
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 82,360评论 2赞 373
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 142,942评论 0赞 325
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 52,507评论 1赞 267
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 61,324评论 5赞 358
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 46,299评论 1赞 273
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 36,685评论 3赞 386
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 35,358评论 0赞 254
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 39,652评论 1赞 293
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 34,704评论 2赞 312
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 36,465评论 1赞 326
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 32,318评论 3赞 313
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 37,711评论 3赞 299
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 28,991评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 30,265评论 1赞 251
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 41,661评论 2赞 342
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 40,864评论 2赞 335

机器学习-Tensorflow

为什么选Tensorflow

Tensorflow 安装

Tensorflow基础架构

如何搭建结构

用Tensorboard可视化神经网络

高阶内容

推荐阅读更多精彩内容