爬取不同分辨率下的不同地图图片数据

爬取不同分辨率下的不同地图图片数据

from math import *
import urllib
import urllib2
import requests
import os
url_list=[]
# 生成url,如/8/0/0.png,8/0/1.png.../8/0/255.png.../8/255/255.png
def create_url(first,second):
    for y in range(int(pow(2,second))):
        for z in range(int(pow(2,second))):
            url_list.append(str(first)+'/'+str(y)+'/'+str(z)+'.png')
            print str(first)+'/'+str(y)+'/'+str(z)+'.png'
    return url_list

# 生成url对应的目录
def create_dirs(url_list,base_filepath):
    for x in url_list:
        x = x.split('/')
        file_path = base_filepath + str(x[0]) + '/' + str(x[1])+'/'
        if not os.path.exists(file_path):
            print file_path

            os.makedirs(file_path)


base_url = 'http://a.tile.openstreetmap.org/'
# 图片下载
def download_png(url_list,filepath):
    for x in url_list:
        url = base_url + x
        urllib.urlretrieve(url, filename='d:/test/'+x)
        # data = f.read()
        # with open(filepath + x, "wb+") as code:
        #     code.write(data)
url_list=create_url(8,8)
download_png(url_list,'d:/test/')
#create_dirs(url_list,'d:/test/')

用法

  • 先修改文件路径,分辨率等参数
  • 然后先注释掉download_png函数调用,先调用create_dirs函数创建目录,然后取消注释开始下载图片

采用多进程爬取,并处理网络带来的IOError

from math import *
import urllib
import urllib2
import requests
import os
from exceptions import IOError
import logging
import logging

logging.basicConfig(level=logging.WARNING,
                format='%(asctime)s %(filename)s[line:%(lineno)d] %(levelname)s %(message)s',
                datefmt='%a, %d %b %Y %H:%M:%S',
                filename='myapp.log',
                filemode='w')

url_list=[]
filepath = 'd:/test/'
base_url = 'http://a.tile.openstreetmap.org/'

def create_url(start,rate):
    for y in range(start,int(pow(2,rate))):
        for z in range(int(pow(2,rate))):
            url_list.append(str(rate)+'/'+str(y)+'/'+str(z)+'.png')
            logging.warning(str(rate)+'/'+str(y)+'/'+str(z)+'.png')
    return url_list

def create_dirs(url_list,base_filepath):
    for x in url_list:
        x = x.split('/')
        file_path = base_filepath + str(x[0]) + '/' + str(x[1])+'/'
        if not os.path.exists(file_path):
            logging.warning(file_path)
            os.makedirs(file_path)


def download_png(url_list,filepath):
    for x in url_list:
        try:
            url = base_url + x
            print url
            logging.warning(url)
            urllib.urlretrieve(url, filename=filepath+x)
        except IOError as serr:
            logging.error(serr)
            time.sleep(180)
            urllib.urlretrieve(url, filename=filepath+x)

import multiprocessing
import time

def worker_1(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)



def worker_2(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)

def worker_3(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)

def worker_4(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)

def worker_5(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)

def worker_5(start,rate):
    url_list = create_url(start, rate)
    create_dirs(url_list, filepath)
    download_png(url_list, filepath)

if __name__ == "__main__":
    p1 = multiprocessing.Process(target = worker_1, args = (630,10))
    p2 = multiprocessing.Process(target = worker_2, args = (700,10))
    p3 = multiprocessing.Process(target = worker_3, args = (800,10))
    p4 = multiprocessing.Process(target = worker_4, args = (900, 10))
    p5 = multiprocessing.Process(target = worker_5, args = (1000, 10))
   

    p1.start()
    p2.start()
    p3.start()
    p4.start()
    p5.start()
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,902评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 84,037评论 2 377
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,978评论 0 332
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,867评论 1 272
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,763评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,104评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,565评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,236评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,379评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,313评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,363评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,034评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,637评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,719评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,952评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,371评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,948评论 2 341

推荐阅读更多精彩内容