之前我爬了datav的地图选择器中全国省市区的geoJSON数据
为了获取最新省市区的行政区划代码用于级联组件,又爬了国家统计局的内容
https://github.com/lyhmyd1211/AreaJson_CN
index_2019_level_3.json:全国省市区 3 级 6 位行政区划代码
index_2019_level_5.json:全国省市区县乡镇 5 级 12 位行政区划代码
province 文件夹是全国各省行政区划代码(文件名开头的两位数为各省行政区划代码前两位)
province/level_3 为各省 3 级 6 位行政区划代码
province/ level_5 为各省 5 级 12 位行政区划代码
getArea.py 为简易的爬虫脚本,需要修改爬取内容的见脚本说明
脚本说明:
# config #
year = '2019' # 年份,目前国家统计局官网有2009-2019年的数据
level = 3 # 可选:3|5 获取的层级 3层为省-市-区 最多5级省-市-区-县(街道)-乡镇(居委会)
digit = 6 # 可选:6|12 行政区划代码位数 层级为3级时通常使用6位代码 如110000,层级为5级时使用12位代码 如 110000000000
head_url = "index" # 可选:index|各省行政区划前两位 要从哪开始获取 index为全国所有省份 要获取单独的省份修改为省行政区划的前两位
# config #
按照注释修改 config 中的内容再运行脚本可以获取自己想要的结果