目标:
-访问单个像素并作出修改
-查看图像相关属性
-操作图像中指定区域
-图像通道的分离和合并
大部分操作除了用到 opencv 也用到了 numpy
访问单个像素并作出修改
首先引入需要的库
import cv2
import numpy as np
加载一张图像
img = cv2.imread('photo.jpg')
通过行列坐标访问图像中的像素 -> img[行,列]
px = img[100, 100]
比如 BGR 图像会返回关于 B G R 值的数组,灰度图像则会直接返回相应的灰度
px = img[10, 10]
print px
>>>[157, 166, 200]
只访问蓝色像素
blue = img[10, 10, 0]
print blue
>>>157
对像素作出修改
img[10, 10] = [255, 255, 255]
print img[100, 100]
>>>[255, 255, 255]
注意: Numpy 可以更快速高效的访问数组阵列,所以像上面这样直接访问,修改单个像素,是相对低效的。但 Numpy 总是返回一个纯量,在操作一块区域上还是需要使用上面提到的方法。
使用 Numpy 更高效的访问单个像素
# accessing RED value
img.item(10, 10, 2)
>>>59
使用 Numpy 修改像素
# modifying RED value
img.itemset((10, 10, 2), 100)
img.item(10, 10, 2)
>>> 100
查看图像相关属性
图像属性包括行列数,通道,数据类型,像素总数。
.shape 返回图像的行列数,如果图像具有色彩还会返回通道数
print img.shape
>>>(512, 512, 3)
注意:如果是灰度图像只会返回行列数
.size 返回总像素数
print img.size
>>>786432
.dtype 返回数据类型
print img.dtype
>>>uint8
操作图像中的指定区域
有时候我们需要操作图像中的某一块区域。比如检测出图像中的人的眼睛,首先在整张图片中检测脸的位置,接着仅在检测到的脸区域中再检索出眼睛,而不用直接在全图中找,这样做提高了准确性(因为眼睛的长在脸上的呀 :D),同时也提高了效率(毕竟我们最终只搜索了一小块区域)
ball = img[280:340, 330:390]
img[273:333, 100:160] = ball
上面的操作产生下图的效果
图像通道的分离和合并
有时候我们需要单独操作图像的各个通道,所以要先分离它们,处理完成还需要再次合并它们。我们可以这么做:
b,g,r = cv2.split(img)
img = cv2.merge((b,g,r))
或者
b = img[ : , : , 0]
再比如我们只需要将红色像素全部置0,可以直接使用 numpy 进行操作,而不用先分离,修改,再合并,那样更快不是吗,就像下面这样
img[ : , : , 2] = 0
cv2.split() 是个相对耗时的操作,除非你确实需要用它,不然的话尽可能使用高效快速的 numpy 吧
原文:
http://docs.opencv.org/master/d3/df2/tutorial_py_basic_ops.html