第九章 ArcPy数据访问模块 ||| 第十一章 使用加载项自定义ArcGIS界面
我们将在本章介绍以下几个案例:
- 获取工作空间内的要素类列表
- 使用通配符限制返回的要素类列表
- 使用要素类型限制返回的要素类列表
- 获取要素类或表中的字段列表
- 调用Describe()函数返回要素类的描述信息
- 调用Describe()函数返回栅格数据的描述信息
- 调用Describe()函数返回工作空间信息
引言
Python脚本提供了执行批处理操作的功能。这将帮助你完成自动化工作流程并提高数据处理效率。举个例子,你可能需要遍历磁盘上所有的数据集并对每一个数据集执行某项特定操作。编写地理处理任务的主体部分之前,你第一步通常是完成初步的数据收集。这一初步的数据收集工作通常调用ArcPy中的一个或多个列表函数来实现。这些列表函数返回Python列表对象。这些列表对象可通过遍历操作以进行后续处理。ArcPy提供了大量可用于返回数据列表的函数。这些函数可以处理许多不同类型的GIS数据。本章中,我们将了解ArcPy中许多用于创建数据列表的函数。在第三章管理地图文档和图层中,我们也介绍了一些列表函数。不过,这些列表函数与arcpy.mapping
模块相关,且专门用于处理地图文档和图层。我们在本章中介绍的列表函数直接位于arcpy
站点包中,并且更为通用。
我们还会介绍Describe()
函数,该函数返回一个包含属性组的动态对象。这些动态生成的Describe
对象中包含的属性组内容取决于所要描述的数据类型。当我们对一个要素类调用Describe()
函数,则返回要素类特定属性。另外,不论什么数据类型的数据都会获取一组通用Describe
对象属性。
获取工作空间内的要素类列表
同我们将在本章中介绍的其他列表函数一样,获取工作空间内的要素类列表通常是脚本中执行多步骤处理流程的第一步。举个例子,你可能想要对某个文件地理数据库内的所有要素类添加一个新的字段。那么你就首先需要获取该工作空间内所有要素类的数据列表。
Getting ready
ArcPy提供的列表函数可获取字段列表,索引列表,数据集列表,要素类列表,文件列表,栅格数据列表,表列表等。ListFeatureClasses()
函数可用于创建工作空间内的所有要素类列表。该函数接受三个可选参数用于限制返回的列表内容。其中第一个通配符参数根据要素类名称来限制返回的要素类。第二个类型参数根据数据类型(点,线,面等)来限制返回的要素类。第三个数据集参数根据要素数据集来限制返回的要素类。在本案例中,我们会返回工作空间内所有的要素类。
How to do it...
按照以下步骤来学习如何调用ListFeatureClasses()
函数来获取工作空间内的要素类列表:
1.打开IDLE,打开一个新的脚本窗口。
2.脚本保存为C:\ArcpyBook\Ch10\ListFeatureClasses.py
文件。
3.导入arcpy
模块:
import arcpy
4.设置工作空间路径:
arcpy.env.workspace = "C:/ArcpyBook/data/CityOfSanAntonio.gdb"
必须牢记一点,你在调用列表函数前需先设置工作空间路径。否则的话,列表函数就不知道要提取哪个数据集的数据列表。
5.调用ListFeatureClasses()
函数并将返回结果赋值给变量fcList
:
fcList = arcpy.ListFeatureClasses()
6.循环遍历fcList
中每个要素类并打印到屏幕上:
for fc in fcList:
print fc
7.保存并运行脚本。你会看到如下结果:
Crimes2009
CityBoundaries
CrimesBySchoolDistrict
SchoolDistricts
BexarCountyBoundaries
Texas_Counties_LowRes
Burglary
How it works...
调用列表函数之前,你首先需要设置工作空间环境参数以确定当前工作空间路径。ListFeatureClasses()
函数接受三个可选参数来限制返回的要素类。其他大部分的列表函数的工作方式基本如此。不过在本案例中,我们调用ListFeatureClasses()
函数时并没有传递任何参数。这样处理的结果就是返回的Python列表对象中包含了当前工作空间内的所有的要素类,之后通过for
循环迭代列表中的内容。列表中的每一个要素类都是包含要素类名称的字符串来表示。
There's more...
除了返回工作空间内的要素类列表,你还可能需要获取表列表。ListTables()
函数返回工作空间内的独立表数据列表。列表内容可通过表名称或表类型来筛选。表类型参数包括dBase
,INFO
和ALL
。列表中的所有的值都是包含表名称的字符串数据类型。
使用通配符限制返回的要素类列表
默认情况下,ListFeatureClasses()
函数会返回工作空间内所有的要素类。你可能想通过某种方式来限制返回的列表内容。ListFeatureClasses()
函数接受三个可选参数来限制返回的要素类。所有的参数都是可选的。第一个参数是通配符参数,该参数基于字符的组合来限制返回的列表内容。其他的参数分别根据数据类型和要素集来限制返回的内容。
Getting ready
ListFeatureClasses()
函数使用通配符作为第一个参数来限制返回的要素类列表。通配符是根据名称来限制列表内容。比如,你可能想只返回名称以B
开头的要素类列表。你就可以结合使用字母B
与星号(*
)来实现。下面的代码示例展示了使用通配符来限制列表内容:
fcs = arcpy.ListFeatureClasses("B*")
在本案例中,你将学习如何通过使用通配符来限制返回的要素类列表:
How to do it...
按照以下步骤来学习如何在ListFeatureClasses()
函数中使用通配符参数来限制返回的要素类列表:
1.打开IDLE,加载C:\ArcpyBook\Ch10\ListFeatureClasses.py
脚本。
2.在列表函数中添加通配符参数来仅返回名称以字母C
开始的要素类列表。
fcs = arcpy.ListFeatureClasses("C*")
3.保存并运行脚本。你会看到如下结果显示:
Crimes2009
CityBoundaries
CrimesBySchoolDistrict
How it works...
ListFeatureClasses()
函数接受三个可选参数,其中通配符参数基于名称来限制返回的要素类列表。在本案例中,我们使用了通配符(*
)来限制返回的列表中仅包含名称以C
开头的要素类
使用要素类型限制返回的要素类列表
ListFeatureClasses()
函数除了使用通配符来限制返回的要素类,你还可以通过要素类型来筛选返回的内容。
Getting ready
除了使用通配符来限制ListFeatureClasses()
函数返回的列表内容,要素类型限制条件也可以与通配符一起使用或单独使用来限制列表内容。举个例子,下面的示例代码展示了使用两个限制条件来限制返回的列表中仅包含以字母B
开头的面要素类。在本案例中,你将使用要素类型参数以及通配符参数一起来限制返回的要素类:
fcs = arcpy.ListFeatureClasses("B*","Polygon")
How to do it...
按照以下步骤来学习如何在ListFeatureClasses()
函数中使用要素类型来限制返回的要素类列表:
1.打开IDLE,加载C:\ArcpyBook\Ch10\ListFeatureClasses.py
脚本。
2.在列表函数中添加要素类参数来仅返回名称以字母C
开始的面要素类列表。
fcs = arcpy.ListFeature("C*","Polygon")
3.保存并运行脚本。你会看到如下结果显示:
CityBoundaries
CrimesBySchoolDistrict
How it works...
ListFeatureClasses()
函数中的第二个可选参数根据要素类型来限制返回的结果。在本案例中,我们限制仅返回面要素。其他的要素类型包括点(Point),线(Polyline),区域(Region)等。
There's more...
ListFeatureClasses()
函数中的第三个可选参数是要素集名称。该参数筛选出位于特定要素集内的要素类。当该参数没有在调用ListFeatureClasses()
函数中指定,则返回当前工作空间内的独立要素类。
获取要素类或表中的字段列表
要素类和表中会包含有至少一列的属性信息。你可以调用ListFields()
函数返回要素类中的字段列表。
Getting ready
ListFields()
函数返回的列表中包含了要素类或表中每个字段对应的一个Field
对象。像ListFields()
和ListIndexes()
的函数会要求一个输入数据集作为执行对象。你可以使用通配符或字段类型来限制返回的字段。每一个Field
对象包含了多个只读属性,包括名称(Name),别名(AliasName),类型(Type),长度(Length)等。
How to do it...
按照以下步骤来学习如何返回一个要素类中的字段列表:
1.打开IDLE,创建一个新的脚本窗口。
2.脚本保存为C:\ArcpyBook\Ch10\ListOfFields.py
文件。
3.导入arcpy
模块。
import arcpy
4.设置工作空间路径:
arcpy.env.workspace = "C:/ArcpyBook/data/CityOfSanAntonio.gdb"
5.在try
语句块中对Burglary
要素类调用ListFields()
函数:
try:
fieldList = arcpy.ListFields("Burglary")
6.循环遍历字段列表中的每一个字段,并打印字段名称,类型以及长度。确保代码缩进:
for fld in fieldList:
print "%s is a type of %s with a length of %i" % (fld.name,fld.type,fld.length)
7.添加except
语句:
except Exception as e:
print e.message
8.完整代码如下:
import arcpy
arcpy.env.workspace = "C:/ArcpyBook/data/CityOfSanAntonio.gdb"
try:
fieldList = arcpy.ListFields("Burglary")
for fld in fieldList:
print "%s is a type of %s with a length of %i" %(fld.name,fld.type,fld.length)
except Exception as e:
print e.message
9.保存并运行脚本。你会看到如下结果显示:
OBJECTID is a type of OID with a length of 4
Shape is a type of Geometry with a length of 0
CASE is a type of String with a length of 11
LOCATION is a type of String with a length of 40
DIST is a type of String with a length of 6
SVCAREA is a type of String with a length of 7
SPLITDT is a type of Date with a length of 8
SPLITTM is a type of Date with a length of 8
HR is a type of String with a length of 3
DOW is a type of String with a length of 3
SHIFT is a type of String with a length of 1
OFFCODE is a type of String with a length of 10
OFFDESC is a type of String with a length of 50
ARCCODE is a type of String with a length of 10
ARCCODE2 is a type of String with a length of 10
ARCTYPE is a type of String with a length of 10
XNAD83 is a type of Double with a length of 8
YNAD83 is a type of Double with a length of 8
How it works...
ListFields()
函数返回要素类或表中的字段列表。该函数接受一个必选参数,即要执行操作的要素类或表的引用地址。你可以使用通配符或字段类型来限制返回的字段。在本案例中,我们仅指定了一个要素类参数,这样就意味着将会返回所有字段。对于返回的每一个字段,我们输出查看其名称,字段类型和字段长度。正如之前在讨论ListFeatureClasses()
所提到的,ListFields()
函数和其他列表函数通常是脚本中执行多步处理的第一步。举个例子,你可能想要更新一个人口统计区要素类中的人口信息字段中的统计数据。要完成这一工作,你需要获取要素类中包含所有字段的列表,然后循环遍历该列表来查找包含人口信息的特定字段名称,最后更新每一行的人口信息。ListFields()
函数还接受一个通配符参数。如果你事先明确了所需字段名称,将其传递给通配符参数,这样就只会返回指定字段。
调用Describe()函数返回要素类的描述信息
数据集包含的信息本质上都是描述性的。比如,要素类包含名称,几何类型,空间参考等。当你在脚本中执行下一步处理前需要查看特定信息的时候,这些描述性信息就很有价值了。比如你可能想只对线状要素而不是点或面要素执行一个缓冲区操作。你可以调用Describe()
函数来获取数据集基本的描述性信息。你可以将这些信息看作元数据。
Getting ready
Describe()
函数提供了获取数据集基本信息的功能。这些数据集包括要素类,表,ArcInfo coverage,图层文件,工作空间,栅格及其他数据集。该函数返回了一个包含描述数据类型特定属性的Describe
对象。Describe
对象中的属性是以属性组的方式进行组织,并且返回的数据集属性信息至少归入一个属性组。
举个例子,对一个地理空间数据库调用Describe()
函数将会返回GDB要素类,要素类,表以及数据集属性组。每一个属性组中包含可被访问的特定属性。
Describe()
函数接受一个字符串参数用来指向数据源。下面的代码示例中,我们传递了一个包含在地理空间数据库中要素类的引用参数。该函数会返回一个包含了一组动态属性的Describe
对象,其中这些动态属性的集合称为属性组:
arcpy.env.workspace = "c:/ArcpyBook/data/CityOfSanAntonio.gdb"
desc = arcpy.Describe("SchoolDistricts")
print "The feature type is: " + desc.featureType
The feature type is: Simple
print "The shape type is: " + desc.shapeType
The shape type is: Polygon
print "The name is: " + desc.name
The name is: SchoolDistricts
print "The path to the data is: " + desc.path
The path to the data is: c:/ArcpyBook/data/CityOfSanAntonio.gdb
不论什么数据类型,所有的数据集都会包含一组默认的属性集合包含在Describe
对象中。这些属性都是只读的。其中一些常用的属性包括数据类型(dataType
),目录(catalogPath
),名称(name
),路径(path
)以及文件(file
)。
在本案例中,你将编写一个脚本调用Describe()
函数来获取一个要素类中的描述性信息。
How to do it...
按照以下步骤来学习如何获取要素类的描述性信息:
1.打开IDLE,打开一个新的脚本窗口。
2.脚本保存为C:\ArcpyBook\Ch10\DescribeFeatureClass.py
文件。
3.导入arcpy
模块。
import arcpy
4.设置工作空间路径:
arcpy.env.workspace = "C:/ArcpyBook/data/CityOfSanAntonio.gdb"
5.添加try
语句块:
try:
6.对Burglary
要素类调用Describe()
函数并打印几何类型:
dsscFC = arcpy.Describe("Burglary")
print "The shape type is: " + descFC.shapeType
7.获取要素类的字段列表并打印字段的名称,类别以及长度:
flds = descFC.fields
for fld in flds:
print "Field: " + fld.name
print "Type: " + fld.type
print "Length: " + str(fld.length)
8.获取要素类的四至范围并打印其坐标:
ext = descFC.extent
print "XMin: %f" % (ext.XMin)
print "YMin: %f" % (ext.YMin)
print "XMax: %f" % (ext.XMax)
print "YMax: %f" % (ext.YMax)
9.添加except
语句块:
except Exception as e:
print e.message()
10.完整代码如下:
import arcpy
arcpy.env.workspace = "C:/ArcpyBook/data/CityOfSanAntonio.gdb"
try:
descFC = arcpy.Describe("Burglary")
print "The shape type is: " + descFC.shapeType
flds = descFC.fields
for fld in flds:
print "Field: " + fld.name
print "Type: " + fld.type
print "Length: " + str(fld.length)
ext = descFC.extent
print "XMin: %f" % (ext.XMin)
print "YMin: %f" % (ext.YMin)
print "XMax: %f" % (ext.XMax)
print "YMax: %f" % (ext.YMax)
except Exception as e:
print e.message
11.保存并运行脚本。你会看到如下结果显示:
The shape type is: Point
Field: OBJECTID
Type: OID
Length: 4
Field: Shape
Type: Geometry
Length: 0
Field: CASE
Type: String
Length: 11
Field: LOCATION
Type: String
Length: 40
.....
.....
XMin: -103.518030
YMin: -6.145758
XMax: -98.243208
YMax: 29.676404
How it works...
我们在脚本中对要素类调用Describe()
函数并返回一个要素类属性组以及表属性组和数据集属性组。除了可以访问要素类属性组,你还可以访问表属性组。
表属性组是非常重要的,通过表属性组你可以访问独立表或要素类中的字段。你还可以通过属性组来访问表或要素类中的索引。表属性组中的fields
属性返回一个包含要素类每个字段对应的一个Field
对象的列表。每一个字段都包含一组只读属性,包括名称,别名,长度,类型,比例,精度等等。其中最为有用的属性是名称和类型。在本案例中,我们打印了字段名称,类型和长度。
最后,我们通过调用数据集属性组中的extent
属性返回Extent
对象来输出图层的地理范围。数据集属性组中包含了许多有用的属性。其中最为常用的属性包括extent
和spatialReference
,许多地理处理工具和脚本在执行过程中可能需要这些信息。你还可以获取datasetType
属性和版本化信息等其他属性。
调用Describe()函数返回栅格数据的描述信息
栅格文件同样包含描述性信息,而这些信息也可以通过调用Describe()
函数获取。
Getting ready
栅格数据集同样可以调用Describe()
函数来获取其描述信息。本案例中,你将通过返回的地理范围和空间参考信息来描述一个栅格数据集。Describe
对象除了包含一个通用的数据集属性组之外,还包含了数据集的SpatialReference
对象。该对象可用于获取数据集详细的空间参考信息。
How to do it...
按照以下步骤来学习如何获取一个栅格影像文件的描述信息:
1.打开IDLE,打开一个新的脚本窗口。
2.脚本保存为C:\ArcpyBook\Ch10\DescribeRaster.py
文件。
3.导入arcpy
模块。
import arcpy
4.设置工作空间路径:
arcpy.env.workspace = "C:/ArcpyBook/data"
5.添加try
语句块:
try:
6.对栅格数据集调用Describe()
函数,确保代码缩进以位于try
语句块内:
descRaster = arcpy.Describe("AUSTIN_EAST_NW.sid")
7.获取栅格数据集的四至范围并打印坐标:
ext = descRaster.extent
print "XMin: %f" % (ext.XMin)
print "YMin: %f" % (ext.YMin)
print "XMax: %f" % (ext.XMax)
print "YMax: %f" % (ext.YMax)
8.获取SpatialReference
对象并打印名称和类别:
sr = descRaster.spaitalReference
print sr.name
print sr.type
9.添加except
语句块:
except Exception as e:
print e.message
10.完整代码如下:
import arcpy
arcpy.env.workspace = "C:/ArcpyBook/data"
try:
descFC = arcpy.Describe("AUSTIN_EAST_NW.sid")
ext = descRaster.extent
print "XMin: %f" % (ext.XMin)
print "YMin: %f" % (ext.YMin)
print "XMax: %f" % (ext.XMax)
print "YMax: %f" % (ext.YMax)
sr = descRaster.spaitalReference
print sr.name
print sr.type
except Exception as e:
print e.message
11.保存并运行脚本。你会看到如下结果显示:
XMin: 3111134.862457
YMin: 10086853.262238
XMax: 3131385.723907
YMax: 10110047.019228
NAD83_Texas_Central
Projected
How it works...
本案例与上一个案例非常相似。两个案例的区别在于本案例对栅格数据集而不是矢量要素类调用Describe()
函数。在两个案例中,我们都调用了extent
属性返回了数据集的地理四至范围。在本案例中我们还获取了栅格数据集的SpatialReference
对象并输出查看了该对象的名称和类型。
调用Describe()
函数返回工作空间信息
ArcGIS中可以使用许多不同类型的地理数据库,包括个人地理数据库,文件地理数据库以及企业地理数据库。如我们在第八章数据查询和选择中所了解到的,构建查询条件语句会依赖于数据集所在的地理数据库的类型的不同而有所差别。脚本在执行前可能并不了解地理数据库的类型。为了能够提高脚本在查询过程中的健壮性,你可以对工作空间对象调用Describe()
函数以获取相关信息来构建相对应的查询语句。
Getting ready
工作空间(workspace)属性组提供了与工作空间有关的信息(比如工作空间类型是文件夹,还是个人地理数据库,文件地理数据库或企业地理数据库)。通过工作空间属性组能够获取的信息包括当工作空间是一个ArcSDE时的连接信息,与地理数据库有关的域以及工作空间类型信息,其中工作空间类型可以是文件系统(FileSystem
),本地数据库(LocalDatabase
)或远程数据库(RemoteDatabase
)。本地数据库(LocalDatabase
)是指个人或文件地理数据库,而远程数据库(RemoteDatabase
)则是指ArcSDE地理数据库。在本案例中,你将利用工作空间属性组来获取一个文件地理数据库的相关信息。
How to do it...
1.打开IDLE,打开一个新的脚本窗口。
2.脚本保存为C:\ArcpyBook\Ch10\DescribeWorkspace.py
文件。
3.导入arcpy
模块。
import arcpy
4.开始try
语句块:
try:
5.对CityOfSanAntonio
地理数据库调用Describe()
函数,确保代码缩进以位于try
语句块内,下面的两行print
语句也需要位于try
语句块中:
descWorkspace = arcpy.Describe("C:/ArcpyBook/data/CityOfSanAntonio.gdb")
6.打印工作空间类型:
print descWorkspace.workspaceType
7.打印工作空间细节信息:
print descWorkspace.workspaceFactoryProgID
8.添加except
语句块:
except Exception as e:
print e.message
9.保存并运行脚本。你会看到如下结果显示:
LocalDatabase
esriDataSourcesGDB.FileGDBWorkspaceFactory.1
How it works...
workspaceType
属性会返回FileSystem
,LocalDatabase
和RemoteDatabase
中一个值。LocalDatabase
值说明你当前处理的是一个个人或文件地理数据库。然而,这样的信息还不够具体。为了能够获取更为具体的信息,你可以访问workspaceFactoryProgID
属性,该属性会指明地理数据库的具体类型。在本案例中是一个文件地理数据库。