爬虫P2P网站某产品交易数据统计分析

前言

通过爬虫p2p网站某产品交易数据,分析实时交易量及增长趋势,判断产品活力。

(因不想体现为某p2p网站,所以里面网站地址使用xxxxxx进行代替,另代码可参看最下方的github地址。)

目录

一、P2P某产品交易量分析

二、工具及相关python包

三、获取网站的标号及交易量并存入本地excel

四、根据excel表格中的数据进行分析统计实时交易量

五、jenkins配置

六、效果图展示如下图

七、gitlab源码地址

一、实现思路

1、提取投标项目号

2、根据标号进入分页进行资金收集

3、将交易量输入excel表格

4、根据excel统计出最新的交易总和

二、工具及相关python包

python3  Pycharm urllib bs4 re xlrd xlutils.copy  jenkins

三、获取网站的标号及交易量并存入本地excel

#导入所需要的相关包

from html.parser import HTMLParser

from urllib import request

from bs4 import BeautifulSoup

import reimport time

import xlrd,xlwt,os,sys,xlutils

from xlrd import open_workbook

from xlutils.copy import copy

#此函数为获取网站的标号及剩余量

def getdata(data1,data2,data3):

  with request.urlopen(data1) as f:

      data = f.read().decode('utf-8').replace(u'\xa9', u'') #listp接收标号的url进行拼接   

      listp = []

     res_tr = re.findall(r'/Venus/\d+',data)

     for i in res_tr:

           listp.append(i) 

    listj = [] 

   listm = []

  #listj接收剩余量 listm接收标号

  for j in listp: 

   listm.append(j.split('/')[2]) #获取/标号

   url = "https://xxxxxxxx.com" + j #拼接标号url 

  with request.urlopen(url) as f:               

              data = f.read().decode('utf-8').replace(u'\xa9', u'') #获取标号页面

  with open(data3, 'w') as f: #标号页面存入data3

             for i in data: f.write(i)

            soup = BeautifulSoup(open(data3)) #使用BeautifulSoup格式化页面html

            jr = (soup.find_all(class_="canbid-amount")) #根据class标签找到剩余量

  if jr: listj.append(str(jr[0]).split('')[1].split('')[0]) #切割剩余量获取数据

  else: listj.append("收益中") #无剩余量显示   

   dictjm = dict(zip(listm, listj)) #剩余量 标号存入字典dictjm

   return dictjm #返回

def sendexcl(url,getjm):

      rexcel = open_workbook(url) #打开excel

      rows = rexcel.sheets()[0].nrows #统计行

      cols = rexcel.sheets()[0].ncols #统计列

      excel = copy(rexcel) #复制表

      table = excel.get_sheet(0) #第一张表

      j = 0

     for i, m in getjm.items(): #字典读取数据excel写入标号

                  table.write(rows, j, i) #第一张表行写入数据j用于定位行列 i为插入数据

                   j += 1 #列后移一位

     rows += 1 #行后移一位

     excel.save(url) #保存数据

     j = 0

    for i, m in getjm.items(): #excel写入剩余量

                table.write(rows, j, m)

                j += 1

   rows += 1

   excel.save(url)

getjm = getdata("https://xxxxxxxxxxxxxx","jmgetlog","jmget1log") #获取剩余量标号字典sendexcl("F:\JIMU\JMQST.xlsx",getjm) #excel存入字典

四、根据excel表格中的数据进行分析统计实时交易量

import xlrd

data = xlrd.open_workbook("F:\JIMU\JMQST.xlsx")

table = data.sheets()[0] # 第几个sheet

nrows = table.nrows # 行数

ncols = table.ncols # 列数

colnames = table.row_values(1) # 某一行数据

print(colnames)

colnames2 = table.row_values(nrows-1)

print(colnames2)

dictn = dict(zip(colnames,colnames2))

del dictn["收益中"]

print(dictn)

listn = []

for i,j in dictn.items():

          i = i.replace(',','')

          j = j.replace(',','')

          m = float(i) - float(j)

          listn.append(m)

print(listn)

m = 0

for i in listn:

       m += i

      print(m)

      print("轻松投减少量为:%f"%(m))

with open('F:\JIMU\pylog', 'a+') as f:

       f.write('\n')

       f.write(str(m))

       print("sucessful ok")

五、jenkins配置

图一为jenkins定时任务配置两分钟进行一次

图二为jenkins python配置 jimuDA3.py获取实时交易量 test1.py 统计交易总


图一定时任务
图二jenkins配置截图

六、效果图展示如下图

图三交易量收集输入excel表格

图四 根据excel表格数据统计出实时的交易量,两分钟统计一次,由图可见最新总交易量为一千一百余万

图三excel截图


图四交易总额

七、github地址

https://github.com/tanghuan123/getdata

https://github.com/tanghuan123/getdata/blob/master/getjmdata.py

https://github.com/tanghuan123/getdata/blob/master/test1.py



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,013评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,205评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,370评论 0 342
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,168评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,153评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,954评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,271评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,916评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,382评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,877评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,989评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,624评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,209评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,199评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,418评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,401评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,700评论 2 345

推荐阅读更多精彩内容

  • 今天以一张照片开始,因为想了半天才进入状态。依然从下班到家开始记录…… 到家以后他激动的告诉我他是坏蛋,爷爷是警察...
    幽香_5126阅读 262评论 0 1
  • 原创/苹儿(茵草芳菲) 叶卡捷琳娜女皇传奇的一生,我充满好奇,她是俄罗斯历史上,唯一一位与彼得大帝齐名的凯瑟琳大帝...
    茵草芳菲阅读 2,264评论 21 25
  • 因果调查设计即实验法。实验法是一种特殊的调查方法,通过所设定的特殊实验场所以及特殊状态,对调查对象进行实验以获得所...
    2b97f9b072f6阅读 510评论 0 0