数据分析的时候, 我们有时候会遇到这样的需求. 就比如当一个GO号对应多个Gene ID的时候,如下: 我们想把它变成GO ID和Gene ID一一对应的关系,这样做的目的是...
Pandas包是我使用最频繁的几个python包之一, 功能强大, 虽然由于项目的原因, 可能会使用R里面的tidyverse来实现同样的功能, 但pandas包也不能忽略....
numpy是Python科学计算生态系统下的一个重要的包, 其它的类似于pandas和scikit-lean都是基于numpy开发而来. 简单来说, numpy的主要对象是一...
这两天,有个小伙伴问我这么一个问题,就是说他公司给了他一个table, 大概是140万行,其中有一列既有数字也有其它字符。例如2021年02月01日,想从里面仅仅把数字提取出...
作为一个传统的人,一直坚持过农历生日,所以过农历生日的当天,阳历生日会围绕着出生当年的阳历生日前后变动。直到突然冒出一个想法,我这一辈子当中,我理论上的阳历生日(出生当年的阳...
win10下装ubuntu双系统(免U盘) 最近决定在win10的基础上装一个ubuntu系统用来管理服务器。但是有一个问题,前段时间U盘不慎丢失,没有启动盘,又想装ubun...
这一讲主要讲ggplot2里面对轴名称,标题title, 以及副标题subtitle相关操作。 先加载相关包,并且画出散点图Scatter plot. 1. 增加标题titl...
数据分析中, 我们有时候会有这样的需求, 比如将已有的数值列,转化为百分位列。 Case study1: 比如说我们有如下表格,代表了ATGC四种碱基的绝对个数。 我们现在想...
出来画图,难免碰到个画箭头的需求。 简单,如下的代码就能安排。 画箭头时一些调整和参数设置,可以参考如下代码,看看箭头的头和尾的圆或者钝怎么设置。