NumPy广播(Broadcast)&&NumPy数组比较

今天看一个通过逻辑回归解决手写数字识别任务的案例，有个之前没有注意到的点，记录一下。

import numpy as np
import pandas as pd


data = pd.read_csv('../data/mnist-demo.csv')  # 导入数据集
pd_train_data = data.sample(frac=0.8)  # 训练集划分
train_data = pd_train_data.values  # Ndarray数组格式
num_training_examples = 6000  # 数据量
y_train = train_data[:num_training_examples, [0]]  # label
print(y_train[:10])
print(np.unique(y_train))

输出如下

[[1]
 [4]
 [5]
 [6]
 [9]]
[0 1 2 3 4 5 6 7 8 9]

那么问题来了current_lables输出是什么？

current_lables = (y_train[:5] == np.unique(y_train)).astype(float)
print(current_lables)

输出结果如下

[[0. 1. 0. 0. 0. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 1. 0. 0. 0.]
 [0. 0. 0. 0. 0. 0. 0. 0. 0. 1.]]

这个我们就要从NumPy广播开始说起了

广播(Broadcast)

广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式，对数组的算术运算通常在相应的元素上进行。
最简单的例子如下：

a = np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b = np.array([0,1,2])
print(a + b)

[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]

下面的图片展示了数组 b 如何通过广播来与数组 a 兼容。感谢菜鸟教程

数组 b 通过广播来与数组 a 兼容

广播的规则:

让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。
输出数组的形状是输入数组形状的各个维度上的最大值。
如果输入数组的某个维度和输出数组的对应维度的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错。
当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值。

简单理解：对两个数组，分别比较他们的每一个维度（若其中一个数组没有当前维度则忽略），满足：

数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。

若条件不满足，抛出 "ValueError: frames are not aligned" 异常。
知道这些之后，我们来看看

数组比较

1.数组与数字进行比较

这个比较容易理解，就是数据比较之后会产生boolean值，感谢华章科技

matrix = np.array([
 [5, 10, 15],
[20, 25, 30],
[35, 40, 45]
])
m = (matrix == 25)
print(m)

[[False False False]
 [False  True False]
 [False False False]]

2.数组与数组进行比较

这个就要注意 如果输入数组的某个维度和输出数组的对应维度的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错。这句话了

正例1，一维数组和一维数组之间比较，一定要长度相同

a = np.linspace(0,10,3)
d = np.linspace(2,4,3)
print(a)
print(d)
e = a > d
print(e)

[ 0.  5. 10.]
[2. 3. 4.]
[False  True  True]

正例2，二维数组和一维数组之间比较，相同维度长度要相同或者为1

a = np.linspace(0,10,5)
d = np.array([[5],[4]])
print(a)
print(d)
e = a > d
print(e)

[ 0.   2.5  5.   7.5 10. ]
[[5]
 [4]]
[[False False False  True  True]
 [False False  True  True  True]]

注意这里 当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值
实际上简单理解就是通过广播，会扩展长度为1的维度。
这也是我们之前案例中结果的由来
但是需要注意反例，即当相同维度上的长度不相同且不为1时，就会出现问题

反例1

a = np.linspace(0,10,5)
d = np.array([[5,6],[4]])
print(a)
print(d)
e = a > d
print(e)

D:/pythonProject/MultinomialLogisticRegression/logistic_regression/tmp_unique.py:80: 
VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences 
(which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated.
 If you meant to do this, you must specify 'dtype=object' when creating the ndarray.
  d = np.array([[5,6],[4]])
Traceback (most recent call last):
  File "D:/pythonProject/MultinomialLogisticRegression/logistic_regression/tmp_unique.py", line 83, in <module>
    e = a > d
ValueError: operands could not be broadcast together with shapes (5,) (2,) 
[ 0.   2.5  5.   7.5 10. ]
[list([5, 6]) list([4])]

这里的错误就是在于相同维度，不同长度(5,)->[ 0. 2.5 5. 7.5 10. ]与 (2,)->[5,6]进行了比较。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 205,132评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 87,802评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,566评论 0赞 338
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,858评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,867评论 5赞 368
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,695评论 1赞 282
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,064评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,705评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 42,915评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,677评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,796评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,432评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,041评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,992评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,223评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,185评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,535评论 2赞 343

NumPy广播(Broadcast)&&NumPy数组比较

广播(Broadcast)

数组比较

1.数组与数字进行比较

2.数组与数组进行比较

推荐阅读更多精彩内容