爬虫之爬取猫眼电影专业版实时数据排行榜

猫眼电影专业版实时数据排行榜是个持续更新的用ajax写成的网站,一般而言,爬取它比较麻烦,需要使用ajax/js进行爬取,python中的requests库可以获取网站的ajax,再通过json库解析,就可以完成爬取。

#猫眼电影实时爬取  
#2017/8/1  
import os  
import requests  
import json  
import time   
import csv  
  
#链接url  
def get_to_link():  
    try:  
        r = requests.get("https://box.maoyan.com/promovie/api/box/second.json")  
        r.raise_for_status()  
        r.encoding = r.apparent_encoding  
        return r.text  
    except:  
        print("链接错误!!!")  
        return ''  
  
#json化字符串  
def json_text(text):  
    jd = json.loads(text)  
    return jd  
  
#返回实时日期  
def date_time(jd):  
    ja = jd['data']  
    date = ja['queryDate']#返回日期  
    alltime = ja['updateInfo'].split()[1]#返回时间  
    money = ja['totalBox'] + ja['totalBoxUnit']#返回总票房  
    return date,alltime,money  
  
#返回影片票房  
def movie_price(jd):  
    jl = jd['data']['list']  
    for i,jls in enumerate(jl,1):  
        name = jls['movieName']#影片名  
        try:  
            days = jls['releaseInfo'][2]#上映时间  
        except:  
            days = '点映'  
        totalmoney = jls['sumBoxInfo']#影片总票房  
        mainmoney = jls['boxInfo']#综合票房  
        moneyrate = jls['boxRate']#票房占比  
        shownumber = jls['showInfo']#排片场次  
        showrate = jls['showRate']#排片占比  
        people = jls['avgShowView']#场均人次  
        showpeople = jls['avgSeatView']#上座率  
          
        yield i,name,days,totalmoney,mainmoney,moneyrate,shownumber,showrate,people,showpeople  
  
#创建文件夹  
def makeasocket(path):  
    if not os.path.exists(path):  
        os.makedirs(path)  
      
#保存到csv中  
def save_to_csv(path,date,alltime,moeny,movie_price):  
    with open(path + '猫眼电影专业版实时数据.csv','a') as f:  
        writer = csv.writer(f)  
        writer.writerow(['日期',date,'','时间',alltime,'','总票房',moeny])  
        writer.writerow(['排名','影片名','上映时间(/天)','影片总票房','综合票房(/万)','票房占比(%)','排片场次','排片占比(%)','场均人次','上座率(%)'])  
        for movie in movie_price:  
            writer.writerow([movie[0],movie[1],movie[2],movie[3],movie[4],movie[5],movie[6],movie[7],movie[8],movie[9]])  
  
  
  
def main():  
    path = 'D:/数据/猫眼电影专业版数据/'  
    makeasocket(path)  
    while True:    
        text = get_to_link()  
        jd = json_text(text)  
        date,alltime,moeny = date_time(jd)  
        print('***'*46)  
        print('{:>10s}:{}{:>10s}:{}{:>10s}:{}'.format('日期',date,'时间',alltime,'总票房',moeny))  
        print('---'*46)  
        print('{:^6s}{:^20s}{:^10s}{:^12s}{:^12s}{:^10s}{:^10s}{:^6s}{:^6s}{:^6s}'.format('排名','影片名','上映时间(/天)','影片总票房(/亿)','综合票房(/万)','票房占比(%)','排片场次','排片占比(%)','场均人次','上座率(%)'))  
        print('---'*46)  
        for movie in movie_price(jd):  
            print('{:^6d}{:^20s}{:^20s}{:^20s}{:^12s}{:^11s}{:^13s}{:^10s}{:^10s}{:^10s}'.format(movie[0],movie[1],movie[2],movie[3],movie[4],movie[5],movie[6],movie[7],movie[8],movie[9]))  
            print('---'*46)  
        save_to_csv(path,date,alltime,moeny,movie_price(jd))  
        time.sleep(3)  
  
if __name__ == "__main__":  
    main()  
  
  
Contact GitHub API Training Shop Blog About  
© 2017 GitHub, Inc. Terms Privacy Security Statu  

github代码参考:https://github.com/zhuxunyu/cinema-/blob/master/%E7%8C%AB%E7%9C%BC%E7%94%B5%E5%BD%B1%E5%AE%9E%E6%97%B6%E7%88%AC%E5%8F%96.py

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容

  • 前端知识体系http://www.cnblogs.com/sb19871023/p/3894452.html 前端...
    秋风喵阅读 12,337评论 7 163
  • 七弦声声慢关情, 岩心自许两生花。 极愿人间莫离别, 夜月迢递照吾家。
    柒夜阅读 266评论 0 1
  • 在盛夏,来自窗外的 蝉鸣又开始催促。 在你踟躇的脚下, 一切都凋谢得匆忙。 宽硕的叶子已经褪去了青涩, 仍然温柔地...
    安度无恙年华阅读 216评论 3 3
  • 谢谢你带给我的一切 记得最初见你还是在礼堂,那时我们高一参加活动,我坐在你身旁。回想起脑海那次也许是我记忆中第...
    然然的小馒头阅读 226评论 0 0