Mat - 基本图像容器
目标
我们有多种方法从现实世界中获取数字图像:数码相机,扫描仪,计算机断层扫描和磁共振成像等等。
在任何情况下,我们(人类)看到的都是图像。然而,当将其转换到数字设备时,我们记录的是图像中每个点的数值,即灰度值。
例如在上述图像中,可以看到的汽车图像只不过是包含像素点所有强度值的矩阵。
OpenCV 是一个计算机视觉库,其主要重点是处理和操纵这些矩阵信息。 因此,需要熟悉的第一件事是OpenCV如何存储和处理图像。
Mat
OpenCV自2001年以来发展。刚开始,库围绕着 C接口构建,并将图像存储在内存,它们使用了一个称为IplImage的C结构。在大部分旧版教程和教材中可以看到它的存在。IplImageC结构的问题是它带来了C语言的缺点。最大的问题是手动内存管理。它建立在假设用户负责处理内存分配和释放的基础上。
虽然对于小的程序,这不是一个问题,一旦代码增长,我们将更多地处理内存分配和释放的问腿,而不是专注于解决图像处理问题。
幸运的是C++来了,并介绍了类的概念,使用户或多或少更容易通过自动内存管理。好消息是C ++与C完全兼容,因此不会出现兼容性问题。因此,OpenCV2.0引入了一个新的C++接口,提供了一种新的处理方式,这意味着您不需要调节内存管理,从而使您的代码简洁。C ++接口的主要缺点是,目前许多嵌入式开发系统只支持C。因此,除非必须使用嵌入式平台,否则无需使用旧的C接口。
了解Mat的第一件事是不再需要手动分配内存,并在不需要它时立即释放它,并且大多数OpenCV函数将自动分配其输出数据。如果使用已经创建的Mat对象(已经为矩阵分配了所需的空间),那么这可以被重新使用。
Mat是一个具有两个数据部分的类:矩阵头(包含矩阵的大小,用于存储的方法,存储地址的信息等等)和指向包含像素值矩阵的指针(维度取决于所选存储方法)。矩阵头大小是恒定的,然而矩阵本身的大小可能会随着图像的不同而变化。
OpenCV是一个图像处理库。它包含大量的图像处理功能。为了解决计算量巨大这个挑战,大多数时候你最终会使用库的多个功能。因此,将图像传递给函数是常见的做法。
每个Mat对象都有自己的头,但是矩阵可以通过使它们的矩阵指针指向相同的地址而共享。因此,复制操作符只会将头和指针复制到大的矩阵,而不是数据本身。例如:
Mat A, C; // creates just the header parts
A = imread(argv[1], IMREAD_COLOR); // here we'll know the method used (allocate matrix)
Mat B(A); // Use the copy constructor
C = A; // Assignment operator
所有上述操作,最后都指向相同的单一数据矩阵。然而,他们的头是不同的,对它们中的任何一个进行修改也会影响其他。实际上,不同的对象只是为相同的底层数据提供不同的访问方法。然而,它们的头部分是不同的。真正有趣的部分是可以创建仅引用一部分完整数据的头。例如,要在图像中创建感兴趣的区域(ROI),您只需创建一个新边界的头:
Mat D (A, Rect(10, 10, 100, 100) ); // using a rectangle
Mat E = A(Range::all(), Range(1,3)); // using row and column boundaries
我们可能好奇,当一个矩阵本身属于多个Mat对象,不再需要时怎么负责清理它。答案是:使用它的最后一个对象。这是通过使用引用计数机制来处理。每当复制Mat对象的头部时,矩阵的计数器就会增加。
每当头部被清空时,这个计数器就会减少。当计数器达到零时,矩阵也被释放。
那我们想要复制矩阵本身,该怎么办呢?贴心的OpenCV提供了cv :: Mat :: clone()和cv :: Mat :: copyTo()函数。
Mat F = A.clone();
Mat G;
A.copyTo(G);
现在修改F或G不会影响Mat头指向的矩阵。Note:
OpenCV函数的输出图像内存分配是自动的(除非另有说明)。
不需要考虑使用OpenCV C++的内存管理。
赋值运算符和拷贝构造函数仅复制矩阵头。
可以使用cv :: Mat :: clone()和cv :: Mat :: copyTo()函数复制图像的基础矩阵本身。
存储方法
如何存储像素值? 可以自由选择使用的颜色空间和数据类型。颜色空间是指我们如何组合颜色分量以编码给定的颜色。最简单的一个是我们所掌握的颜色是黑色和白色的灰度级。这些组合使我们能够创建许多灰色阴影。
对于彩色空间表达,有更多的选择方法。每个都将它们分解为三到四个基本颜色变量,我们可以使用这些组合来创建其他颜色。最流行的是RGB,主要是因为这与我们的眼睛如何识别颜色有关。其基色为红,绿,蓝。为了对颜色的透明度进行编码,有时会添加第四个元素:即alpha(A)。
其他颜色空间系统也都有自己的优势:
- RGB 是最常见的,因为我们的眼睛使用类似的东西,但请记住,OpenCV标准显示系统使用BGR颜色空间
- HSV 和 HLS 将颜色分解为色调,饱和度和值/亮度分量,这是我们描述颜色更自然的方式。例如,如果忽略最后一个分量,则算法对输入图像的光线条件不太敏感。
- YCrCb 被流行的JPEG图像格式使用。
- CIE L * a * b *是一种感知统一的色彩空间,如果您需要测量给定颜色与另一种颜色的距离,则可方便使用。
每个颜色空间分量都有自己的有效域。这导致使用不同的数据类型。我们如何存储颜色变量是关键。最小数据类型可能是char,这意味着一个字节或8位。这可能是无符号的(可以存储从0到255的值)或带符号(从-127到+127的值)。如果用三个颜色分量(例如RGB)表示,则已经有1600万个可能的颜色来表示。为了更好的表示,也可以使用float(4字节= 32位)或双(8字节= 64位)数据来获得更精细的控制。然而,增加颜色变量的大小会增加内存中整个画面的大小。
创建一个 Mat 对象
虽然Mat作为一个图像容器非常好,但它也是一个通用的矩阵类。因此,可以创建和操纵多维矩阵。可以通过多种方式创建Mat对象:
Mat M(2, 2, CV_8UC3, Scalar(0, 0, 255));
cout << "M = " << endl << " " << M << endl << endl;
对于二维多通道图像,我们首先定义它们的大小:行和列数。
然后,我们需要指定用于存储元素的数据类型和每个矩阵点的通道数。为此,我们根据以下约定构造了多个定义:
CV_ [每个项目的位数] [有符号或无符号] [类型前缀] C [通道号]
例如,CV_8UC3 意味着我们使用8位长的无符号字符类型,并且每个像素都有三个通道。这是最多可以有四个预定义的通道。
该cv::Scalar是使用自定义值初始化所有矩阵点。
如果需要更多功能,您可以使用上部宏来创建类型,在括号中设置通道号,如下所示。
使用C / C ++数组并通过构造函数进行初始化:
int sz[3] = { 2,2,2 };
Mat L(3, sz, CV_8UC(1), Scalar::all(0));
上面的例子显示了如何创建一个具有两维以上的矩阵。指定其维度,然后传递包含每个维度的大小的指针,其余的保持不变。
- cv::Mat::create function:
M.create(4, 4, CV_8UC(2));
cout << "M = " << endl << " " << M << endl << endl;
无法使用此结构初始化矩阵值。如果新的大小不适合旧的,它将仅重新分配其矩阵数据存储器。
- 类MATLAB样式初始化器: cv::Mat::zeros , cv::Mat::ones , cv::Mat::eye . 指定要使用的大小和数据类型:
Mat E = Mat::eye(4, 4, CV_64F);
cout << "E = " << endl << " " << E << endl << endl;
Mat O = Mat::ones(2, 2, CV_32F);
cout << "O = " << endl << " " << O << endl << endl;
Mat Z = Mat::zeros(3, 3, CV_8UC1);
cout << "Z = " << endl << " " << Z << endl << endl;
- 对于小矩阵,可以使用逗号分隔的初始化器或初始化器列表(在最后一种情况下需要C ++ 11支持):
Mat C = (Mat_<double>(3, 3) << 0, -1, 0, -1, 5, -1, 0, -1, 0);
cout << "C = " << endl << " " << C << endl << endl;
C = (Mat_<double>({ 0, -1, 0, -1, 5, -1, 0, -1, 0 })).reshape(3);
cout << "C = " << endl << " " << C << endl << endl;
- 为现有的Mat对象和创建一个新矩阵头 cv::Mat::clone or cv::Mat::copyTo:
Mat RowClone = C.row(1).clone();
cout << "RowClone = " << endl << " " << RowClone << endl << endl;
- 注意: 可以使用 cv::randu()函数填写带有随机值的矩阵。需要给出随机值的较低和较高值:
Mat R = Mat(3, 2, CV_8UC3);
randu(R, Scalar::all(0), Scalar::all(255));