1 研究区位置:
2 数据:
2.1 夜间灯光数据
2020年全球VIRS夜间光由国家海洋和大气管理局(NOAA)地球观测组、国家地球物理数据中心(NGDC)提供(从NOAA/NGDC - Earth Observation Groupdmsp/downloadV4composites.html下载)。
2.2 地表覆盖数据
土地覆盖信息是从2020年Globcover陆地覆盖地图中收集的全球30 m地表覆盖数据(http: //www.globallandcover.com/GLC30Download),
2.3 MODIS-EVI数据
EVI数据是美国国家航空航天局(NOAA/NGDC - Earth Observation Group - Defense Meteorological Satellite Progam, Boulder)提供的MOD13Q1数据
2.4 GDP数据、人口数据和其它统计数据均来自各省的统计年鉴,为了在多层次估计区域经济数据方面应用NPP-VIIRS TNL数据,我们使用省和地级行政区域进行分析。在中国,行政区域主要有三个层次:省、地、县。在这项研究中,选择了河南省、山东省、安徽省和江苏省,以及研究区内的63个地级市进行了统计。
3方法
3.1TNL和土地覆盖数据的结合
制定回归模型来校正灯光总和与经济活动数据之间的关系,对总经济活动进行估计,这些估计值在空间分布中产生空间分类的1 平方公里经济活动地图。假设生活在较暗地区的农村人口对经济活动(主要是通过农业活动)作出贡献。但是,人口通常根据居住地而不是工作场所。农业活动与土地使用和土地覆盖密切相关。因此,土地覆盖数据是农业对GDP进行研究的合适辅助数据。刘等人[25]研究显示,中国不同地区的大片未照明区域(如DMSP-OLS)受到开花效应的影响。因开花效应的存在,导致难以从周边农村土地上提取城市区域。用于解决开花效应问题的方法各有不同:阈值方法[26-27],指数方法[28]和分类方法[29]。阈值法由于其简单性和相对准确性,是最常见的应用方法之一。如土地使用/覆盖或植被,以确定阈值值。例如,利用MODIS数据、Landat TM数据以及土地利用和覆盖数据,成功划分城市和农业区域或研究区内寻找最佳阈值。
为了区分耕地和人造地表区域,同时处理了夜间灯光数据和土地覆盖数据。首先,根据研究区域的边界提取了NPP-VIIRS、地表覆盖数据和MODIS-EVI数据,并转换为WGS-84地理参考系统。为了区分植被和城市区域,在ARCGIS中利用全球地表覆盖数据和MODIS土地覆盖数据进行数据提取分析。应用了阈值技术[30],以检测开花区域,以消除它们在夜间灯光数据中可能造成的潜在影响。通过使用地表覆盖数据,确定了研究区域的城市区域,并计算了人工和相关区域的平均EVI 值 (0.412)。然后,未位于人工地表且具有EVI 值的像素> 0.412和TNL DN值> 0 被确定为潜在的开花区域。这些潜在开花像素的平均NTL DN值为2.29。因此,在NPP-VIIRS图像中选择了3的DN阈值,以去除农业中开化效应。因此,从农业用地中计算并提取了具有TNLDN值高于3的区域。通过这种方式,确定了农业GDP聚集的潜在领域。
3.2 计算夜间光线指数
夜间灯光遥感在研究应用中多使用表示区域特性的灯光总强度(TNL)、平均相对灯光强度I和综合灯光指数(CNLI),灯光灰度值大于零的区域为有效灯光区域,可以通过灯光指数的变化来研究该区域在一段时间内的发展变化,也可以用灯光指数的变化评价地震的破坏和震后恢复情况。灯光总强度指研究区域灯光灯光灰度值总和;灯光面积比灯光像元面积和区域总面积的比,综合灯光指数是指平均灯光强度(I)和灯光的面积比(S)的乘积。计算公式如下
3.3回归模型
考虑到分析数据和规模的差异,采用了不同的回归模型来揭示TNL值与经济指标之间的关系。为了研究统计数据与模拟GDP在像素水平上更密切的关系,我们考虑了三种不同的回归模型。包括线性回归模型、指数模型和多项式模型。
y表示研究区预测的GDP; x 代表TNL指数;am 是常数;pm是权重。这三种回归模型应用于63个地级市的数据,以估计研究区生产总值。为了绘制GDP的空间分布图,市级GDP需要按像素水平进行分类。我们使用模拟 GDP 和 TNL 指数的最佳模型将 GDP 分解为像素比例。因此,模拟 GDP 与市一级的实际 GDP 之间可能会存在偏差,因为模拟 GDP 与最佳模型的模拟 GDP 使用光像素值,而不是 TNL 总值[1]。为了纠正这些潜在的偏差,我们需要在像素级别校正模拟GDP(式8)。
3.4 模型验证
模型验证是GDP空间分布建模的重要程序。R2是评估回归函数表现的常用指标,作为观察值和拟合值之间的相关行。此外,对非农业GDP估计的验证采用四个指标进行:误差(RE)、总相对误差(ZRE)、平均相对误差(MRE)、平均绝对误差(AAE)和相对差(RRMSE)。 在下面的方程中,GDPS和GDPg是省一的GDP的观察值和模拟值,n是各市的总数。
(RE)是从预测的 GDP 和每个行政区域的 GDP 统计数据中得出的,用于评估回归函数对GDP 估计的能力;ZRE是衡量研究领域产生的总误差的一个很好的指标;而AAE 则测量平均绝对偏差。MRE 源自 ZRE,用于测量研究区GDP估算回归模型的准确性;RRMSE表示和真实值的差别。整个技术流程图(图4)。
4. GDP密度图
根据市级尺度GDP空间化的方法(见方法部分),结合NPP-VIIRS、MODIS EVI和地表覆盖数据,计算了代表研究区2020年农业和非农业GDP的空间密度图。(图9)中的非农业GDP是通过首先模拟最合适的回归模型,然后在像素水平上使用(式8)中的公式来校正模拟结果。可以注意到,非农业GDP密度来自高度城市化的地区,绿色显示了农业GDP的像素水平(500米×500米)分布;高农业GDP主要集中在研究区的北部、西部和东南地区,这些区域地势平坦、土地肥沃、水资源丰富,非常适合农业;且农业GDP最高的地区大部分为粮食作物;农业产出大多位于城市核心区周围或靠近农村中心。