240 发简信
IP属地:北京
  • 基于Tkinter小型应用开发经验总结

    项目进行到后期,基于目前试验结果和所有数据,已经完成初步的模型建立,需要根据现有模型和算法,对算法和模型进行包装,完成black box黑盒子,...

  • Resize,w 360,h 240
    基于树模型的特征选择及模型可解释性

    1. 基于tree base的特征选择 以决策树为基础的模型有很多,包括最常用的randomforest,deep-forest和GBDT之类,...

  • python-yield 与multiprocessing pool的问题

    Backgroud 最近在处理比对后的bam文件,文件大小约为15G左右,由于内存限制,准备使用生成器的模型分块读取文件,同时进行多进程的处理,...

    0.1 80 0 1
  • Resize,w 360,h 240
    数据分析与图形化-seaborn作图总结

    python中常用的数据图形化库有matplotlib,seaborn,plotnine以及pandas自带的图形化功能等(目前我接触的)。在这...

  • 相关性分析

    在我们进行数据处理时,相关性分析是我们最常使用的分析方法之一。相关性,即衡量二个特征或者两个变量之间的关联程度。两个变量的相关关系意味着二者之间...

  • 置信区间

    在大部分科研文献里面,我们基本都能看得到置信区间这个词汇,比如95%的置信区间。我们都知道的是,统计学的本意是通过样本的情况去预估整体,比如我们...

  • python中的排列组合

    在日常的工作学习中,我们肯定会遇到排列组合问题,比如,在5种颜色的球中,任意取3个,共有多少种组合方式,这也包括有放回和无放回抽样。在pytho...

  • Resize,w 360,h 240
    归一化与标准化

    归一化与标准化操作是数据预处理过程中常见的数据处理(特征缩放)方法。常见的归一化标准化有四种。 1、极大极小归一化在数据集中,使用数据的值减去极...

  • 关于matplotlib外接显示的问题

    Python matplotlib问题如果出现在shell5里跑程序,需要画图,但是运行到最后会报错如下:QXcbConnection: Cou...