【Python性能分析】Mysql、Pandas、Python列表,三者的查询性能谁强谁弱?

原文地址 https://www.cyberlight.xyz/passage/data-analyse-performance

这篇笔记测试Mysql、Pandas、Python列表的大数据查询性能。

手中有一张72万余行的数据库表,借此机会测试三者的数据查询性能,终于解决内心疑问。


测试环境:Ubuntu 20.04 LTS, Python 3.8.2, Intel® Core™ i7-8750H CPU @ 2.20GHz × 12

原数据有8列,724100行,sql文件大小 65.5 MB

数据表第8列为时间,下面用三种方法分别按时间降序,记录每种方法的用时(每种方法测试3次,取平均值)


一、Mysql

1.测试性能,通过Python调用Mysql

以下为测试源码

import pandas as pd

import mysql.connector

import datetime

def connect():

    mydb = mysql.connector.connect(

      host="127.0.0.1",

      user="root",

      passwd="sdddddddd",

      database="abc"

    )

    return mydb

def sql():

    mydb = connect() 

    mycursor = mydb.cursor()

    start = datetime.datetime.now()

    mycursor.execute("SELECT * FROM My_table ORDER BY time DESC") #按time列降序

    end = datetime.datetime.now()

    print(end - start) #测试Mysql查询性能


    data_sql = mycursor.fetchall()

    mycursor.close()

    mydb.close()

    return data_sql

def main():

    data_sql = sql()

if __name__ == "__main__":

    main()

测试结果如图

三次取平均值为 0.652s

这只是Python调用Mysql的性能,这和Mysql的真实性能有不同吗?为了避免Python产生的误差,接着再测试一组直接用Mysql查询的性能。

2、测试性能,直接通过Mysql查询

输入如下命令排序查询

SELECT * FROM My_table ORDER BY time DESC

首次测试得到的时间如图

测试3次的时间分别为 0.668s、0.664s、0.702s,平均值 0.678s

由此得出,Python调用Mysql 和 直接使用Mysql查询,性能几乎一致,可忽略不计。


二、Pandas

以下为Pandas的测试源码

import pandas as pd

import mysql.connector

import datetime

def connect():

    mydb = mysql.connector.connect(

      host="127.0.0.1",

      user="root",

      passwd="sdddddddd",

      database="abc"

    )

    return mydb

def pa():

    mydb = connect()

    mycursor = mydb.cursor()


    mycursor.execute("SELECT * FROM eb7_today")

    data_sql = mycursor.fetchall()

    data = pd.DataFrame(data_sql, columns=['1', '2', '3', '4', '5', '6', '7', 'time'])

    start = datetime.datetime.now()

    data.sort_values('time', ascending=False, inplace = True) #按time列降序

    end = datetime.datetime.now()

    print(end - start) #测试Pandas排序时间

    mycursor.close()

    mydb.close()

    return data

def main():

    data = pa()

if __name__ == "__main__":

    main()

下面为测试结果

三次取平均值为 0.433s


三、Python列表

以下为Python列表的测试源码

import pandas as pd

import mysql.connector

import datetime

def connect():

    mydb = mysql.connector.connect(

      host="127.0.0.1",

      user="root",

      passwd="sdddddddd",

      database="abc"

    )

    return mydb

def py():

    mydb = connect()

    mycursor = mydb.cursor()


    mycursor.execute("SELECT * FROM My_table")

    data_sql = mycursor.fetchall()

    start = datetime.datetime.now()

    data_sql.sort(key=lambda x:x[7], reverse=True) #按第8列降序(time列)

    end = datetime.datetime.now()

    print(end - start) #测试Python列表的查询性能

    mycursor.close()

    mydb.close()

    return data_sql

def main():

    data_sql = py()

if __name__ == "__main__":

    main()

测试结果如下

三次取平均值为 0.064s


四、总结

1.在Python中调用Mysql 和 直接使用Mysql查询,性能几乎一致,可忽略不计。

2.大数据查询性能 Python列表 > Pandas > Mysql

测试数据为,Mysql查询时间  0.652s,Pandas查询时间 0.433s,Python列表查询时间 0.064s


看来Python大数据分析性能很强的~

这里想到一个问题,Pandas 基于 NumPy 开发,内部实现由C语言完成,理论性能应该极强,为什么测试中Python列表性能反而强于Pandas?(大概强5倍)希望知道的朋友留言,谢谢!共同进步~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342