都是一些很小的知识点的汇总,持续更新。你也可看出来,我也是刚刚开始学,一边学一学应用。
一、字符串与unicode
Python中的普通字符串在内部是以8位的ascii码存储的,而unicode字符串则存储为16位unicode字符。这样能表示更多的字符集。
unicode字符串前面使用u前缀,就像原始字符串使用r一样。
在Python3.0中,所有的字符串都是unicode字符串
unicode转成字符串,设置编码方式即可。
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
二、取出字符串中的数字
解析网页时,经常遇到取出一个字符串中的一个数字,比如“ 阅读 3215”,使用内建函数filter即可。
s=‘ 阅读 3215’
print filter(str.isdigit,s)
如果是取出一个字符串中的多个不连续的数字,使用正则表达式
三、拼接字符串多个参数
'%s%s'%(param1,param2)
url = 'http://www.dianping.com/search/category/1/10/%s%s'%(lbs,ft)