目标
学会:
- 访问像素值并修改它们
- 访问图像属性
- 设置感兴趣区域(ROI)
- 分割并合并图像
本节中几乎所有的操作都主要与Numpy相关,而不是与OpenCV相关。要使用OpenCV编写更好的优化代码,需要Numpy的丰富知识。
(示例将在Python终端中显示,因为其中大多数只是单行代码)
访问和修改像素值
让我们先加载彩色图像:
>>> import numpy as np
>>> import cv2 as cv
>>> img = cv.imread('messi5.jpg')
您可以通过像素的行和列坐标来访问它。对于BGR图像,它将返回蓝色,绿色,红色值的数组。对于灰度图像,仅返回相应的灰度强度。
>>> px = img[100,100]
>>> print( px )
[157 166 200]
# accessing only blue pixel
>>> blue = img[100,100,0]
>>> print( blue )
157
您可以用相同的方式修改像素值。
>>> img[100,100] = [255,255,255]
>>> print( img[100,100] )
[255 255 255]
警告
Numpy是用于快速数组计算的优化库。因此,简单地访问每个像素值并对其进行修改将非常缓慢,因此不建议使用。
注意
上面的方法通常用于选择数组的区域,例如前5行和后3列。对于单个像素访问,Numpy数组方法array.item()
和array.itemset()
更好。但是,它们始终返回标量,因此,如果要访问所有B,G,R值,则需要为每个值分别调用array.item()
。
更好的像素访问和编辑方法:
# accessing RED value
>>> img.item(10,10,2)
59
# modifying RED value
>>> img.itemset((10,10,2),100)
>>> img.item(10,10,2)
100
访问图像属性
图像属性包括行数,列数和通道数;图像数据类型;像素数;等等
图像的形状可通过img.shape
访问。它返回行,列和通道数的元组(如果图像是彩色的):
>>> print( img.shape )
(342, 548, 3)
注意
如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。
像素总数可通过访问img.size
:
>>> print( img.size )
562248
图片数据类型是通过img.dtype
获取的:
>>> print( img.dtype )
uint8
注意
img.dtype
在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。
图像ROI
有时,您将不得不玩某些图像区域。对于图像中的眼睛检测,首先在整个图像上进行面部检测。当获得一张脸时,我们仅选择脸部区域并在其中搜索眼睛,而不是搜索整个图像。它提高了准确性(因为眼睛总是在脸上:D)和性能(因为我们在小范围内搜索)。
使用Numpy索引再次获得ROI。在这里,我要选择球并将其复制到图像中的另一个区域:
>>> ball = img[280:340, 330:390]
>>> img[273:333, 100:160] = ball
查看以下结果:
分割和合并图像通道
有时,您需要在图像的B,G,R通道上单独工作。在这种情况下,您需要将BGR图像拆分为单个通道。在其他情况下,您可能需要合并这些单独的通道来创建BGR图像。您可以通过以下方式简单地做到这一点:
>>> b,g,r = cv.split(img)
>>> img = cv.merge((b,g,r))
或者
>>> b = img[:,:,0]
假设您要将所有红色像素都设置为零-您不需要先拆分通道。numpy索引更快:
>>> img[:,:,2] = 0
警告
cv.split()是一项昂贵的操作(就时间而言)。因此,仅在必要时使用它。否则请进行Numpy索引。
为图像设置边框(填充)
如果要在图像周围创建边框(如相片的边框),则可以使用cv.copyMakeBorder()。但是它在卷积运算,零填充等方面有更多应用。此函数采用以下参数:
- src - 输入图像
- top, bottom, left, right - 边界的宽度,以相应方向上的像素数表示
-
borderType - 定义要添加哪种边框的标志。它可以是以下类型:
- cv.BORDER_CONSTANT - 添加恒定的彩色边框。该值由下一个参数给出。
- cv.BORDER_REFLECT - 边框将是边框元素的镜像,像这样:fedcba | abcdefgh | hgfedcb
- cv.BORDER_REFLECT_101或 cv.BORDER_DEFAULT - 和上一个相同,但略有变化,例如:gfedcb | abcdefgh | gfedcba
- cv.BORDER_REPLICATE - 最后一个元素被复制,像这样:aaaaaa | abcdefgh | hhhhhhh
- cv.BORDER_WRAP - 不好解释,它看起来像这样:cdefgh | abcdefgh | abcdefg
- value - 边框颜色,仅支持边框类型为cv.BORDER_CONSTANT
下面是一个示例代码,演示了所有这些边框类型,以便更好地理解:
import cv2 as cv
import numpy as np
from matplotlib import pyplot as plt
BLUE = [255,0,0]
img1 = cv.imread('opencv-logo.png')
replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)
plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
plt.show()
请参阅下面的结果。(图像使用matplotlib显示。因此红色和蓝色通道将互换):