本文介绍基于Python中的gdal
模块,对大量长时间序列的栅格遥感影像文件,绘制其每一个波段中、若干随机指定的像元的时间序列曲线图的方法。
在之前的文章Python GDAL绘制栅格像元数值变化曲线图(https://www.jianshu.com/p/344e2ccba0e1)中,我们就已经介绍过基于gdal
模块,对大量多时相栅格图像,批量绘制像元时间序列折线图的方法。不过当时文章中的需求,每1
个时相都对应着3
个不同的遥感影像文件,而每1
个遥感影像文件则都仅仅只有1
个波段;而在本文中,我们每1
景遥感影像都对应着2
个波段,我们最终绘制的多条曲线图,也都来自于这每1
景遥感影像的不同波段。
我们再来明确一下本文的需求。现在有一个文件夹,其中放置了大量的遥感影像文件,如下图所示。其中,所有遥感影像都是同一地区、不同成像时间的图像,其各自的空间参考信息、像元行数与列数等都是一致的,文件名中有表示成像日期的具体字段;且每1
景遥感影像都具有2
个波段。现在我们希望,在遥感影像覆盖的区域内,随机选取若干的像元,基于这些像元,我们绘制其随时间变化的曲线图。因为我们的每个遥感影像都有2
个波段,且都希望绘制出曲线图,因此最终的曲线图一共就有2
条曲线。
明确了需求,我们就可以开始代码的撰写。本文用到的代码如下。
# -*- coding: utf-8 -*-
"""
Created on Tue Jul 25 23:04:41 2023
@author: fkxxgis
"""
import os
import random
import matplotlib.pyplot as plt
from osgeo import gdal
def load_image(image_path):
dataset = gdal.Open(image_path)
band1 = dataset.GetRasterBand(1).ReadAsArray()
band2 = dataset.GetRasterBand(2).ReadAsArray()
del dataset
return band1, band2
def plot_time_series(image_folder, pic_folder, num_pixels):
image_files = [file for file in os.listdir(image_folder) if file.endswith(".tif")]
band1_merge, band2_merge = [], []
i = 0
for image_file in image_files:
image_path = os.path.join(image_folder, image_file)
band1, band2 = load_image(image_path)
band1_merge.append(band1)
band2_merge.append(band2)
i += 1
x_size, y_size = band1.shape
pixel_indices = random.sample(range(x_size * y_size), num_pixels)
for pixel_index in pixel_indices:
x, y = divmod(pixel_index, y_size)
band_list_1, band_list_2 = [], []
for i in range(len(band1_merge)):
band_data_1 = band1_merge[i]
band_list_1.append(band_data_1[x, y])
band_data_2 = band2_merge[i]
band_list_2.append(band_data_2[x, y])
plt.figure()
plt.plot(range(len(band1_merge)), band_list_1, label="Band 1")
plt.plot(range(len(band1_merge)), band_list_2, label="Band 2")
plt.xlabel("Time")
plt.ylabel("NDVI")
plt.ylim(0, 1000)
plt.title(f"Time Series for Pixel at ({x}, {y})")
plt.legend()
plt.savefig(os.path.join(pic_folder, str(x) + "_" + str(y)))
plt.show()
image_folder_path = "E:/02_Project/Result/test"
pic_folder_path = "E:/02_Project/TIFF/Plot"
num_pixels = 50
plot_time_series(image_folder_path, pic_folder_path, num_pixels)
上述代码的具体含义如下。
首先,我们导入了需要使用的库;其中,os
用于处理文件路径和目录操作,random
用于随机选择像素,matplotlib.pyplot
则用于绘制图像。
随后,我们定义函数load_image(image_path)
;这个函数接收一个影像文件路径image_path
作为输入参数。随后,在函数内使用gdal
库打开该影像文件,然后提取其第一个和第二个波段的数据,并分别存储在band1
和band2
中。最后,函数返回这两个波段的数据。
接下来,我们定义函数plot_time_series(image_folder, pic_folder, num_pixels)
;这个函数接收三个输入参数,分别为image_folder
、pic_folder
和num_pixels
。其中,image_folder
为包含多个.tif
格式的影像文件的文件夹路径,pic_folder
是保存生成的时间序列图像的文件夹路径,而num_pixels
则指定了随机选择的像素数量,用于绘制时间序列图——这个参数设置为几,我们最后就会得到几张结果图像。
在这个函数的内部,我们通过os.listdir
函数获取image_folder
中所有以.tif
结尾的影像文件,并将这些文件名存储在image_files
列表中。然后,我们创建两个空列表band1_merge
和band2_merge
,用于存储所有影像文件的2
个波段数据。接下来,我们遍历所有影像文件,逐个加载每个影像文件的全部波段数据,并将它们添加到对应的列表中。其次,使用random.sample
函数从像素索引的范围中随机选择num_pixels
个像素的索引,并保存在pixel_indices
列表中。接下来,我们遍历并恢复pixel_indices
中的每个像素索引,计算该像素在每个影像中的每个波段的时间序列数据,并存储在band_list_1
、band_list_2
列表中。
随后,我们即可绘制两个时间序列图,分别表示2
个波段在不同影像日期上的数值。最后,我们将图像保存到指定的文件夹pic_folder
中,命名规则为x_y
,其中x
与y
分别代表像素的横、纵坐标。
执行上述代码,我们即可在指定的文件夹路径下看到我们生成的多张曲线图;如下图所示。
其中,每1
张图像都表示了我们2
个波段在这段时间内的数值走势;如下图所示。
至此,大功告成。