PY3 批量导入EXCEL到数据库脚本模板

1、支持分批导入(可配置)

2、批量导入降低数据库操作

3、批量数据错误会自动重新生成导入数据最终只剩下错误数据,保证数据正确率和打入率最大化

CODE:

    


#!/usr/bin/python3

import xlrd

import pymysql

import os

import json

dataHost = ""

dataUser = ""

dataPwd  = ""

dataName = "test"

#错误数据文件存储位置

errorFile = "./errorFile.json"

#导入数据源

excelFile = "./jb.xlsx"

#一次允许灌入数据库数据的条数

onceInsertNum = 5

#一次允许灌入数据库的原始数据

dataList = []

#一次允许最多读入EXCEL数据条数

onceReadExcelNum = 10

# 打开数据库连接

print("连接数据库.......")

db = pymysql.connect(dataHost,dataUser,dataPwd,dataName)

print("数据库连接成功!")

'''

    将数据灌入数据库

'''

def insertDbData(params=[], onceInsertNums=20):

    lens = len(params)

    if lens < 1:

        print("无插入数据")

        return

    if int(lens / onceInsertNums) * onceInsertNums == lens:

        tempLens = int(lens / onceInsertNums)

    else:

        tempLens = int((lens / onceInsertNums) + 1)

    for i in range(tempLens):

        dataList.clear()

        # SQL 插入语句


        jnums = onceInsertNums

        if i == tempLens - 1:

            if tempLens * onceInsertNums != lens:

                jnums = lens % onceInsertNums


        for j in range(i*onceInsertNums, i*onceInsertNums+jnums):

            dataList.append(params[j])

        sqlLists = getSqlLists(dataList)

        insertData(sqlLists)

def getSqlLists(params=[]):

    sql = "INSERT INTO test(bh,ptdjr,gcrxm,khjl,jsyxm,bjscjc,cph,dgjc,bz) VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s) "

    lists = []

    # for i in params:

    #    sql += str(tuple(i)) + ","

    # sql = sql.strip(',')

    # sql += ";"

    for i in params:

        lists.append(tuple(i))

    return [[sql, lists]]

def insertData(sqlLists):

    # 使用cursor()方法获取操作游标

    cursor = db.cursor()

    try:

        print("开始操作数据库.....")

        for sql in sqlLists:

            print(sql[0])

            print(sql[1])

            # 执行sql语句

            cursor.executemany(sql[0], sql[1])

        db.commit()

        print("提交数据成功!")

        # results = cursor.fetchall()

        # print(results)

    except:

        # 发生错误时回滚

        db.rollback()

        print("插入失败=>数据回滚中")

        writeFiles(errorFile ,dataList)

#获取EXCEL数据

def redDataFormExcel(fileName):

    dontReadRows = [0,1]

    dontReadCols = []

    # 打开execl

    workbook = xlrd.open_workbook(fileName)

    # 根据sheet索引或者名称获取sheet内容

    Data_sheet = workbook.sheets()[0]  # 通过索引获取

    # Data_sheet = workbook.sheet_by_index(0)  # 通过索引获取

    # Data_sheet = workbook.sheet_by_name(u'Sheet2')  # 通过名称获取

    rowNum = Data_sheet.nrows  # sheet行数

    colNum = Data_sheet.ncols  # sheet列数

    print("行数:" + str(rowNum))

    print("列数:" + str(colNum))

    if int(rowNum / onceReadExcelNum) * onceReadExcelNum == rowNum:

        tempRowNum = int(rowNum / onceReadExcelNum)

    else:

        tempRowNum = int(rowNum / onceReadExcelNum) + 1

    iCnt = 0

    lists = []

    rowlist = []

    while iCnt < tempRowNum:

        print("-----------------------------开始读取数据---------------------------")

        getRowNum = onceReadExcelNum

        if iCnt == tempRowNum - 1:

            if tempRowNum * onceReadExcelNum != rowNum:

                getRowNum = rowNum % onceReadExcelNum

        lists.clear()

        rowListIndex = list(range(iCnt * onceReadExcelNum, iCnt * onceReadExcelNum + getRowNum))

        colListIndex = list(range(colNum))

        for i in dontReadCols:

            if i in colListIndex:

                colListIndex.remove(i)

        for i in dontReadRows:

            if i in rowListIndex:

                rowListIndex.remove(i)

        for i in rowListIndex:

            rowlist = []

            for j in colListIndex:

                rowlist.append(Data_sheet.cell_value(i, j))

            lists.append(rowlist)

        print("--------------------------------读取完成-----------------------------")

        insertDbData(lists, onceInsertNum)

        iCnt += 1

    # 输出所有单元格的内容

    # print(list)

    # os._exit(0)

    # for i in lists:

    #    for j in i:

    #        print(j, '\t\t', end="")

    #    print()

    # 获取整行和整列的值(列表)

    # rows = Data_sheet.row_values(0)  # 获取第一行内容

    # cols = Data_sheet.col_values(1)  # 获取第二列内容

    # print (rows)

    # print (cols)

    # os._exit(0)

    # 获取单元格内容

    # cell_A1 = Data_sheet.cell(0, 0).value

    # cell_B1 = Data_sheet.row(0)[1].value  # 使用行索引

    # cell_C1 = Data_sheet.cell(0, 2).value

    # cell_D2 = Data_sheet.col(3)[1].value  # 使用列索引

    # print(cell_A1, cell_B1, cell_C1, cell_D2)

    # os._exit(0);

    # 获取单元格内容的数据类型

    # ctype:0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

    # print('cell(0,0)数据类型:', Data_sheet.cell(0, 2).ctype)

    # print('cell(1,0)数据类型:', Data_sheet.cell(1, 0).ctype)

    # print('cell(5,1)数据类型:', Data_sheet.cell(5, 1).ctype)

    # print('cell(1,2)数据类型:', Data_sheet.cell(1, 2).ctype)

    # os._exit(0)

    # 获取单元格内容为日期的数据

    # date_value = xlrd.xldate_as_tuple(Data_sheet.cell_value(1,0),workbook.datemode)

    # print(type(date_value), date_value)

    # print('%d:%d:%d' % (date_value[0:3]))

#写入文件

def writeFiles(fileName, data):

    file = open(fileName, "a+", encoding="utf8")

    for i in data:

        temp = i

        if isinstance(i, list):

            temp = json.dumps(i,ensure_ascii=False)

        file.write(temp+"\n")

    file.close()

    print("失败数据写入文件成功")


def readErrorFile():

    if not os.path.exists(errorFile):

        return

    booles = False

    tempIcnt = onceInsertNum

    while True:

        if not booles:

            file = open(errorFile, 'r+', encoding='utf8')

            lines = file.readlines()

            file.seek(0)

            file.truncate()

            file.close()

            tempDataList = []

            for i in lines:

                tempDataList.append(json.loads(i.strip()))

            iCnt = int(tempIcnt / 2)

            tempIcnt = iCnt

            if iCnt == 0:

                iCnt = 1

            if iCnt == 1:

                booles = True

            insertDbData(tempDataList, iCnt)

        else:

            break

if __name__ == '__main__':

    redDataFormExcel(excelFile)

    readErrorFile()

    #关闭数据库

    db.close()

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,098评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,213评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,960评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,519评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,512评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,533评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,914评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,574评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,804评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,563评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,644评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,350评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,933评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,908评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,146评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,847评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,361评论 2 342

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,440评论 0 13
  • 本文以Loadrunner的Java_Vuser脚本为例,来做一个简化版的自动化测试框架(以excel作为数据驱动...
    smooth00阅读 501评论 0 0
  • 1.13感恩日记 感恩今天是周末,我可以去街上采购好多孩子们爱吃的食材,给他们做可口的饭菜。 感恩儿子乖巧懂事,我...
    种子高手阅读 217评论 0 0
  • 今天拿出早已买好的吴军老师的书《见识》,买下来很长一段时间了,可是却一直搁置没有打开。想着最近自己实在写不...
    开往春天的绿萝阅读 172评论 1 1
  • 1、实际预测过程中,一般都把未戍土当火论、辰丑土当水论就行了。 2、虽然看起来辰戍丑未很复杂,实际预测时,只需明白...
    Forin_阅读 776评论 0 0