1、python的with语句有什么功能?
python中的with语句使用于对资源进行访问的场合,保证不管处理过程中是否发生错误或者异常都会执行规定的exit(“清理”)操作,释放被访问的资源,比如有文件读写后自动关闭、线程中锁的自动获取和释放等。
与python中with语句有关的概念有:上下文管理协议、上下文管理器、运行时上下文、上下文表达式、处理资源的代码段。
with语句的语法格式如下:
with context_expression [as target(s)]:
with-body
with语句的执行原理:
context_manager=context_expression
exit=type(context_manager).__exit__
value=type(context_manager).__enter__(context_manager)
exc=True
try:
try:
targer=value
with-body
except:
exc=False
if not exit(context_manager, *sys.exc_info()):
raise
finally:
if exc:
exit(context_manager,None,None,None)
从with的执行原理中可以看出,context_expression返回的对象中必须具有exit和enter两个方法,而且先检查exit方法在检查enter方法。
还可以参考:https://www.ibm.com/developerworks/cn/opensource/os-cn-pythonwith/
2、tensorflow中constant, placeholder, Variable的区别是什么?
在 TensorFlow 中,数据不是以整数、浮点数或者字符串形式存储的。这些值被封装在一个叫做 tensor 的对象中。
常量(constant):tf.constant()
返回的 tensor 是一个常量 tensor,因为这个 tensor 的值不会变。
constant是TensorFlow的常量节点,通过常方法创建,其是计算图(Computational Graph)中的起始节点,是传入数据。
占位符(placeholder):占位符是TensorFlow的占位符节点,也是一种常量,但是由用户在调用运行方法是传递的,也可以将占位符理解为一种形参。即其不像恒定那样直接可以使用,需要用户传递常数值。
变量(Variable):本质也是一个tensor张量,但variable主要用于数据存储,Variable 用于构建一个变量,在计算图的运算过程中,其值会一直保存到程序运行结束,而一般的tensor张量在tensorflow运行过程中只是在计算图中流过,并不会保存下来。
variable必须初始化,主要用于存训练变量,如模型的权重,偏差。placeholder不用初始化,在session.run(xx, feed_dict)时指定,主要用于输入样本。
feed_dict的作用是什么?
x = tf.placeholder(tf.string)
with tf.Session() as sess:
output = sess.run(x, feed_dict={x: 'Hello World'})
用 tf.session.run()
里的 feed_dict
参数设置占位 tensor。上面的例子显示tensor x
被设置成字符串"Hello, world"
。
注意:
如果传入 feed_dict 的数据与 tensor 类型不符,就无法被正确处理.
tf.global_variables_initializer()的作用是什么?
tf.global_variables_initializer()
会返回一个操作,它会从 graph 中初始化所有的 TensorFlow 变量。
3、解释在tensorflow中session的概念。相比keras, tensorflow引入了一些看似繁琐的操作,它引入这些操作的好处 是什么?(D)
1、通过 session
来调用这个操作来初始化所有上面的变量。
tensorflow定义的内容都在“图”这个容器中完成,tensorflow中只是定义了图,图是静态的,在定义完成之后不会运行的,想进行 图 中的节点操作,就需要使用运行函数tf.Session.run
,才能开始运行
2、有什么好处呢?我真的觉得很麻烦。
4、使用tensorflow建立一单层神经网络需要哪些步骤?构建多层网络需要增加哪些步骤?
建立单层神经网络:输入层 -> 输出层
1.标准化
2.前向传播
2.1构建sigmoid函数
2.2 初始化参数,最常见的两个参数是w和b,w叫做权重,b叫做偏差数
2.3 前向传播
3.后向传播
4.参数优化
构建多层神经网络:输入层 -> 隐蔽层 -> 输出层,添加一个隐藏层到网络让它建模更复杂的功能。而且,在隐藏层上使用非线性激活函数可以模拟非线性函数。
5、把保存的变量直接加载到已经修改过的模型有可能产生错误,如何解决这一问题?
命名报错
weights 和 bias 的 name 属性与你保存的模型不同。这是为什么代码报“Assign requires shapes of both tensors to match”
这个错误。saver.restore(sess, save_file)
代码试图把权重数据加载到bias里,把偏置项数据加载到 weights里。
【出错】
# Print the name of Weights and Bias
# 打印权重和偏置项的名字
print('Load Weights: {}'.format(weights.name))
print('Load Bias: {}'.format(bias.name))
with tf.Session() as sess:
# Load the weights and bias - ERROR
# 加载权重和偏置项 - 报错
saver.restore(sess, save_file)
【与其让 TensorFlow 来设定 name 属性,不如让我们来手动设定,没出错】
# Print the name of Weights and Bias
# 打印权重和偏置项的名称
print('Load Weights: {}'.format(weights.name))
print('Load Bias: {}'.format(bias.name))
with tf.Session() as sess:
# Load the weights and bias - No Error
# 加载权重和偏置项 - 没有报错
saver.restore(sess, save_file)
print('Loaded Weights and Bias successfully.')
6、 tf.nn.softmax_cross_entropy_with_logits(logit, lables)
做了哪些计算?
一共分为两步:
1.将logits转换成概率;对网络最后一层的输出做一个softmax,这一步通常是求取输出属于某一类的概率
2.计算交叉熵损失,是softmax的输出向量[Y1,Y2,Y3,...]和样本的实际标签做一个交叉熵.
7、tensorflow, keras, torch是如何指定目标函数的?
目标函数就是损失函数,
损失函数是根据不同的问题来选择的,比如分类问题一般使用交叉熵损失函数,而回归任务则使用rmse或者mse损失函数.
tensorflow
keras
keras的损失函数可以参考这个链接https://keras.io/zh/losses/
是如何优化目标函数的?
优化函数就是我们常说的反调参数的函数,包括:梯度下降函数、随机梯度下降函数等。
是如何优化目标函数的:这三个框架都有多个优化器可以使用,比如Adam等,利用这些优化器来优化目标函数,其实都是利用小批量梯度下降的方法来优化目标函数
8、什么时候需要保存神经网络模型?
需要二次使用的时候,保存模型,可以不用再次进行训练。
tensorflow和torch保存模型的方法各是什么?
tensorflow:
1、不管是save还是restore,我们首先都是要新建一个Saver,使用方法如下:
saver = tf.train.Saver(...)
注意一点:位于tf.train.Saver()
之后的变量将不会被存储!
2、使用Saver类的save接口保存模型
saver.save(...)
pytorch保存模型:
1、官方推荐的方法,只保存和恢复模型中的参数。
torch.save(the_model.state_dict(), PATH)
2、使用这种方法,将会保存模型的参数和结构信息。
torch.save(the_model, PATH)