简单阈值
这里,问题很简单,如果像素值超过阈值,就给分配一个值(可能是白色),否则给分配另一个值(可能是黑色)。用的方法是cv2.threshold。第一个参数是源图片,应该是个灰度图片,第二个参数是阈值,用来分类像素值的。第三个参数是在像素值大于阈值时的最大值。OpenCV提供了不同风格的阈值,由第四个参数决定。不同类型由:
·cv2.THRESH_BINARY
·cv2.THRESH_BINARY_INV
·cv2.THRESH_TRUNC
·cv2.THRESH_TOZERO
·cv2.THRESH_TOZERO_INV
文档里有解释每个类型的意义。
会得到两个输出。第一个是retval,第二个是阈值过滤过的图像。
代码:
import cv2
import numpy as np
from matplotlib import pyplot as plt
img = cv2.imread('gradient.png', 0)
ret,thresh1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
ret,thresh2 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV)
ret,thresh3 = cv2.threshold(img, 127, 255, cv2.THRESH_TRUNC)
ret,thresh4 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO)
ret,thresh5 = cv2.threshold(img, 127, 255, cv2.THRESH_TOZERO_INV)
titles = ['Original Image', 'BINARY', 'BINARY_INV', 'TRUNC', 'TOZERO', 'TOZERO_INV']
images = [img, thresh1, thresh2, thresh3, thresh4, thresh5]
for i in xrange(6):
plt.subplot(2,3,i+1), plt.imshow(images[i],'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
注意:
要画多个图片,我们可以使用plt.subplot()函数。
结果是:
适应性阈值
在前面我们使用了全局的值作为阈值。但是它可能不是在所有条件下都好使,有事图片在不同区域有不同的光线条件。在这种情况下,我们使用适应性阈值。算法计算图片里一个小区域的阈值。我们在同一张图片里的不同区域可以有不同阈值。这会给我们多种光照下更好的结果.
它有三个“特殊”的输入参数,只有一个输出参数。
适应性方法 - 它来决定阈值如何计算出来。
·cv2.ADAPTIVE_THRESH_MEAN_C:阈值是周围区域的差
·cv2.ADAPTIVE_THRESH_GAUSSIAN_C:阈值是周围权重符合高斯分布的区域的权重之和。
块大小 - 它决定了周围区域的大小
C - 它是一个常量,从差值里减出来的或者计算出来的权重差。
下面的代码比较了全局阈值和适应性阈值在处理一个变化光线的图片的差别。
import cv2
import numpy as np
from matplotlib import pyplot as plt
img = cv2.imread('dave.jpg',0)
img = cv2.medianBlur(img,5)
ret, th1 = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
th2 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_MEAN_C,\
cv2.THRESH_BINARY, 11, 2)
th3 = cv2.adaptiveThreshold(img, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C,\
cv2.THRESH_BINARY, 11, 2)
titles = ['Original Image', 'Global Thresholding (v = 127)', 'Adaptive Mean Thresholding', 'Adaptive Gaussian Thresholding']
images = [img, th1, th2, th3]
for i in xrange(4):
plt.subplot(2,2,i+1), plt.imshow(images[i],'gray')
plt.title(titles[i])
plt.xticks([]), plt.yticks([])
plt.show()
结果:
Otsu二值法
在前面说过第二个参数retVal。在我们用到大津二值法的时候会用到。
在全局阈值里,我们使用一个固定值作为阈值,那么我们怎么知道这个值是好还是不好呢?答案是,反复试验,不断探索。但是要注意双峰图片(简单说,双峰图片是频率分布峰值有两个的图片),对于这种图片,我们近似的可以用两个峰的中间的值作为阈值,这就是Otsu二值法的做法。所以简单来说,它自动计算双峰图片的频率分布的阈值。(对于非双峰图片,二值法不准确)
这里用到cv2.threashold()函数,但是传入一个额外的标志位,cv2.THRESH_OTSU。对于阈值,简单传入0.然后算法会算出优化的阈值并作为第二个输出返回。retVal。如果Otsu阈值没用到,retVal和你用的阈值一样。
看下面的例子。输入图片是一个充满噪点的图片,在第一种情况下,我使用全局阈值127,在第二个情况,我使用Otsu阈值,第三个情况,我用5x5的告诉核来国旅图片来除去噪点,然后使用Otsu阈值,看看过滤噪点对结果的提升。
import cv2
import numpy as np
from matplotlib import pyplot as plt
img = cv2.imread('noisy2.png',0)
# global thresholding
ret1, th1= cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)
# Otsu's thresholding
ret2, th2 = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# Otsu's thresholding after Gaussian filtering
blur = cv2.GaussianBlur(img,(5,5), 0)
ret3, th3 = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# plot all the images and their histograms
images = [img, 0, th1, img, 0, th2, blur, 0, th3]
titles = ['Original Noisy Image', 'Histogram', 'Global Thresholding (v=127)', 'Original Noisy Image', 'Histogram', "Otsu's Thresholding", 'Gaussian filtered Image', 'Histogram', "Otsu's Thresholding"]
for i in xrange(3):
plt.subplot(3, 3, i*3 + 1), plt.imshow(images[i*3], 'gray')
plt.title(titles[i*3]), plt.xticks([]), plt.yticks([])
plt.subplot(3, 3, i*3+2), plt.hist(images[i*3].ravel(), 256)
plt.title(titles[i*3+1]), plt.xticks([]), plt.yticks([])
plt.subplot(3, 3, i*3+3), plt.imshow(images[i*3+2], 'gray')
plt.title(titles[i*3+2]), plt.xticks([]), plt.yticks([])
plt.show()
结果:
Otsu二值法是如何工作的
我们通过一个Otsu二值法的Python实现来展示它实际是如何工作的。
由于我们是处理双峰图片,Otsu算法会通过下面的关系式尝试找到能使带权类内方差最小的阈值。
其中:
它实际上找到双峰之间的t值使得两个类都取得最小值。可以像下面这样用Python实现:
img = cv2.imread('noisy2.png',0)
blur = cv2.GaussianBlur(img,(5,5),0)
# find normalized_histogram, and its cumulative distribution function
hist = cv2.calcHist([blur],[0],None,[256],[0,256])
hist_norm = hist.ravel()/hist.max()
Q = hist_norm.cumsum()
bins = np.arange(256)
fn_min = np.inf
thresh = -1
for i in xrange(1,256):
p1, p2 = np.hsplit(hist_norm,[i]) # probabilities
q1, q2 = Q[i], Q[255]-Q[i] # cum sum of classes
b1, b2 = np.hsplit(bins,[i]) # weights
# finding means and variances
m1, m2 = np.sum(p1*b1)/q1, np.sum(p2*b2)/q2
v1, v2 = np.sum(((b1-m1)**2)*p1)/q1, np.sum(((b2-m2)**2)*p2)/q2
# calculates the minimization function
fn = v1*q1 + v2*q2
if fn < fn_min:
fn_min = fn
thresh = i
# find otsu's threshold value with OpenCV function
ret, otsu = cv2.threshold(blur, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
print thresh, ret