shpfile文件是gis领域内储存地理空间信息常用的文件格式,但是很多时候,我们无法直接打开并获取我们想要的信息,而且我在初学的时候,虽然许多博客和百科都对shapefile文件有所介绍,但是我自己在初学的时候并不能很快理解其中的含义,结果是看来半天,还是不知道怎么把我自己想要的路段信息提取出来,所以,本篇文章我将讲述如何提取shpfile文件中我们所需的路网信息;
1.首先我们先来了解一下shpfile文件的组成,一般而言,它由几个子文件组成,下面将介绍各个子文件:
.shp-图形格式,用来保存元素的几何体(通俗来说就是我们地图中的一条条路,一栋栋房子)
.shx-图形索引格式(可以看做对shp文件中的元素的索引)
.dbf-属性格式数据(就是元素的一些属性了,例如路段的路名等)
以上三个均为必须元素,缺一不可,在编程是必须处于同一个文件夹下!而且必须同名,否则一定会保错!另外还有几个可选文件,如prj,保存地理信息系统的投影信息,但这并不是必须的,由于我的主要工作为提取路网中的关键信息所以不继续讲解,感兴趣的可以参考维基百科shpfile
2.路网信息的提取:
在实验前我们首先要明白的是,shp文件中的元素是有各种几何类型的,如下图所示(摘自wiki百科):
其中第一列的值是人为设定的,后面我会通过编程获取这一个值,得到几何元素的类型,在这里要说明的是我们所需的路网一般而言是polyline格式的,也就是折线,现实生活中我们的路是曲线,但机器中,利用多个点,来形成直线保存下来。
下面我将编程,并辅以说明,讲述我们所提取出来的各类信息
首先,python支持shpfile的写入读出有一个专门的集成软件包pyshp,但是在导入的时候记得要写成import shpfile,而不是pyshp!下面我将介绍他的主要用法:
首先我们要打开文件,sf =shapefile.Reader(filename) 这里的filename很灵活,你可以带shp后缀,也可以直接写文件名,但是要注意这并不影响我们队其他文件格式的读取;
然后我们就可以开始获取文件的信息了
如:sf.fields可以获取dbf文件所存储了那些属性
sf.shpType可获取shp文件中几何元素的类型,这里用数字表示,详见上面图标所示,例如我这里
print(sf.shpfileTpye)输出值为3,即折线类型。
sf.bbox为所有元素的最小边界矩阵,输出为列表形式,形式为[xmin,ymin,xmax,ymax]
len(sf)可输出元素个数
shape = sf.shape(x)可获取第x+1个元素的对象。
shapes = sf.shapes()可获取所有对象的列表
在得到每个元素的对象后,我们可以直接读取一下元素的属性:
shape.bbox获取最小边界矩阵
shape.parts获取点集合组成形状。如果形状记录有多个部分,这个属性包含每个部分的第一个点的索引。如果只有一个部分,则返回一个包含0的列表。
shape.points获取该元素的点的集合,如折线由多个点构成,所以得到的往往是二维的列表,其中的每个点元素所记录的坐标一般为【经度,纬度】。
有时候,我们还要读取路段的属性,如路名,道路类型等信息,所以这里可以用:
sf.record(x)获取第x+1个元素的属性的信息
sf.records()获取所有元素的属性列表
而record中的属性顺序和意义,可以用我上面的sf.fields获取。
如果你要嫌麻烦,可以用sf.shapeRecords()同时获取两类信息,但是要注意,使用的时候依旧要加各自相应的后缀,如shapeRecord.shape.属性 ,shapeRecord.record。下面是将如何将路网数据的重要信息写入到Excel表格中的,这里要用到csv文件的写入操作,许多博客都有相关介绍,这里不做赘述;
程序代码
import csv
import shapefile
fileNames = {'城市快速路': 'F:/carpool_item/Beijing/城市快速路_polyline.shp',\
'高速': 'F:/carpool_item/Beijing/高速_polyline.shp',\
'国道': 'F:/carpool_item/Beijing/国道_polyline.shp',\
'九级路': 'F:/carpool_item/Beijing/九级路_polyline.shp',\
'省道': 'F:/carpool_item/Beijing/省道_polyline.shp',\
'县道': 'F:/carpool_item/Beijing/县道_polyline.shp',\
'乡镇村道': 'F:/carpool_item/Beijing/乡镇村道_polyline.shp'}
def WriteData(roadName):
dirName = 'F:/carpool_item/Beijing/xydata/' + roadName + '.csv'
csvFile = open(dirName,'w',newline = '')
writer = csv.writer(csvFile)
name = ['adress','autitude','longitude','phone']
writer.writerow(name)
sf = shapefile.Reader(fileNames[roadName])
shapes = sf.shapes()
lineth = 1
num = 0
for shape in shapes:
for point in shape.points:
temp = [str(num),str(point[0]),str(point[1]),None]
writer.writerow(temp)
lineth += 1
num += 1
csvFile.close()
print(roadName+ ' is ' + str(lineth) + 'points\n'+ 'and ' + str(num) + ' roads\n')
for key in sorted(fileNames.keys()):
WriteData(key)
可以看到,我们所需要的路网数据已经全部提取到csv格式中并存储起来,而且可视化让问题让每条路段的信息更加明确,为进一步的工作打下了基础