python常用功能汇总

用多了python，基础常用的技能也不多，这里汇总下。

1. 数据类型转换

1.1. int <-> string
//convert int to string : s = str(int_value)
//convert string to int : int = int(str_value)

1.2. string <-> list
//convert string to list : l = list(str)
str0 = "asdf"
list0 = list(str0)
print list0 #['a','s','d','f']
str1 = "www.google.com"  
list1 = str1.split(".")  
print list1 #['www','google','com']
str2 = "i am yanan"
list2 = str2.split(" ")
print list2 #['i','am','yanan']
//convert list to string : s = "".join(list) 或 s = ".".join(list)
list0 = ['a','b','c']
str0 = "".join(list0)
print str0  #abcd
str1 = ".".join(list0) 
print str1 #a.b.c.d

1.3. list <-> dictionary

2. 集合：交集、并集、差补、对称差分

相比有序的列表，集合对象是无序的，已经是Python的基本数据类型，被创建的唯一方法是其工厂方法set()和frozenset()，分别对应可变集合set（可以添加或删除元素）和不可变集合frozenset。

list0 = [0,1,3,5,9]
list1 = [1,3,5]
list2 = [3,5,7]

0.list <-> set 列表和集合的互转
//convert list to set : set(list)
>>>s = set(list0)
>>>s
set([0,1,3,5,9])
//convert set to list : list(set)
>>>list(s)
[0,1,3,5,9]
1.操作符和内建方法实现交集、并集、差补、对称差分
1.1. 交集
>>>set(list1) & set(list2)
set([3,5])
>>>list(set(list1) & set(list2))
[3,5]
>>>list(set(list1).intersection(set(list2)))
[3,5]
1.2. 并集
>>>set(list1) | set(list2)
set([1,3,5,7])
>>>list(set(list1) | set(list2))
[1,3,5,7]
>>>list(set(list1).union(set(list2)))
[1,3,5,7]
1.3. 差补或相对补集（s-t指结果中元素只属于s不属于t）
list1 = [1,3,5]
list2 = [3,5,7]
list1相对于list2差1，list2相对于list1差7
>>>set(list1) - set(list2)
set([1])
>>>list(set(list1) - set(list2))
[1]
>>>list(set(list1).difference(set(list2)))
[1]
1.4. 对称差分
>>>set(list1) ^ set(list2)
set([1,7])
>>>list(set(list1) ^ set(list2))
[1,7]
>>>list(set(list1).symmetric_difference(set(list2)))
[1,7]

四种集合类型的区别.png

3. 特殊容器类型的模块：collections

collections模块自Python 2.4版本开始被引入，包含了dict、set、list、tuple以外的一些特殊的容器类型，分别是：

OrderedDict类：排序字典，是字典的子类。引入自2.7。
namedtuple()函数：命名元组，是一个工厂函数。引入自2.6。
Counter类（***）：为hashable对象计数，是字典的子类。引入自2.7。
deque：双向队列。引入自2.4。
defaultdict：使用工厂函数创建字典，使不用考虑缺失的字典键。引入自2.5。

文档参见：collections.Counter

//计数器Counter
from collections import Counter
>>>li = ['aa','aa','aa','bb','bb','cc']
>>>c = Counter(li)
>>>c
Counter({'aa':3,'bb':2,'cc':1})

>>>c_top_list = c.most_common(2)
>>>c_top_list
[('aa',3),('bb',2)]

>>>c_top_dict = dict(c_top_list)
>>>c_top_dict
{'aa':3,'bb':2}
>>>c_top_sorted_list = sorted(c_top_dict.items(),key=lambda item:item[1],reverse=True)
>>>c_top_sorted_list
[('aa',3),('bb',2)]

4. 文件或目录模块：os

import os
//列出文件夹中所有文件
files_list = []
if os.path.exists(dir_path):
    files = os.listdir(dir_path)
    files.sort()
    for i in range(len(files)):
        file_path = os.path.join(dir_path,files[i])
        files_list.append(file_path)
print files_list  #absolute path of all files in dir_path

//创建文件夹
if not os.path.exists(dir_path):
    os.system('mkdir %s'%dir_path)

//取存在的非空的文件
if os.path.exists(file_path):
    if os.path.getsize(file_path):#返回文件大小，如果文件不存在就返回错误
        print 'file exists and is not empty.'

//区别文件几个路径
os.path.abspath(path) #返回绝对路径
os.path.dirname(path) #返回文件路径
os.path.basename(path) #返回文件名

//删除某种类型的文件-扩展名区别-
os.path.splitext(path)  #分割路径，返回文件路径名和文件扩展名的元组
if os.path.splitext(file_path)[1] == '.txt' :
    os.remove(file_path)

shutil：高级的文件操作模块-复制、删除等，对os的补充
import shutil
shutil.rmtree(dir_path) 递归删除一个目录以及目录内的所有内容

5. 获取命令行参数

#-*- coding:utf-8 -*-
import os
import time
import sys
'''some function description of current script'''
def method1():
    code...
def main():
    ##some global paras
    time_start = time.time()

    if len(sys.argv) < 2:
        print 'no pe or se, no viruses or bacterias specified.'
        sys.exit()

    if sys.argv[1].startswith('-'):
        option = sys.argv[1][1:]
        if option == 'version':
            print 'Version 1.0.0\n----------------'
        if option == 'help':
            print 'this is NGS analisis pipelines.\nMainly,for se or pe sequencing,viruses or bacterias identification.\n----------------'

    if sys.argv[1] != '-se' and sys.argv[1]!= '-pe' and len(sys.argv) == 2:
        print 'And,you need to resign the para as \'-pe\'or\'-se\'.'
        sys.exit()

    if sys.argv[1] == '-se' or sys.argv[1]== '-pe':
        if len(sys.argv) == 2:
            print 'you need to supply the para(\'-viruses\'or\'-bacterias\').'
            sys.exit()
        if sys.argv[2] != '-viruses' and sys.argv[2]!= '-bacterias' and len(sys.argv) == 3:
            print 'you need to resign the para as \'-viruses\'or\'-bacterias\'.'
            sys.exit()
        else:
            if sys.argv[1].startswith('-') and sys.argv[2].startswith('-'):
                option_method = sys.argv[1][1:]
                option_database = sys.argv[2][1:]
                if option_method == 'pe':
                    print 'this is for pair end input fastq datas.'
                    if option_database == 'viruses':
                        pipeliner_pe(base_path,option_database)
                if option_method == 'se':
                    print 'this is for single end input fastq datas.'
                    if option_database == 'viruses':
                        pipeliner_se(base_path,option_database)

    time_end = time.time()
    total_time = time_end - time_start
    print 'total_time:%s'%(total_time)

if __name__ == '__main__':
    main()

6. 生物信息中，求read的反向互补序列

seq = 'ATGCATGC'
"".join(list(reversed(seq)))
seq[::-1]

MORE is comming：

读写excel模块：xlrd/xlwt/pandas
画图模块：matplotlib
访问MySQL数据库

END

最后编辑于：2020.08.06 15:14:26

禁止转载，如需转载请通过简信或评论联系作者。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 206,214评论 6赞 481
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 88,307评论 2赞 382
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 152,543评论 0赞 341
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 55,221评论 1赞 279
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 64,224评论 5赞 371
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,007评论 1赞 284
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,313评论 3赞 399
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,956评论 0赞 259
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 43,441评论 1赞 300
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,925评论 2赞 323
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,018评论 1赞 333
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,685评论 4赞 322
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,234评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,240评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,464评论 1赞 261
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,467评论 2赞 352
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,762评论 2赞 345