key:良辰乐 re
- title中文处理
titleTrans = re.compile(r'</title>(.*?)</title>')
titleIterator = titleTrans.finditer(content)
for it in titleIterator:
title = it.group()
print title
print al[0]```
1. 查找tr, td内容
coding=utf-8
import re
import random
import string
import os
s = '''''<table>
<tr>
<td>序列号</td><td>DEIN3-39CD3-2093J3</td>
<td>日期</td><td>2013年1月22日</td>
<td>售价</td><td>392.70 元</td>
<td>说明</td><td>仅限5用户使用</td>
</tr>
</table>
'''
res = r'<td>(.?)</td><td>(.?)</td>'
m = re.findall(res,s,re.S|re.M)
for line in m:
print unicode(line[0],'utf-8'),unicode(line[1],'utf-8') #unicode防止乱码
输出结果如下:
序列号 DEIN3-39CD3-2093J3
日期 2013年1月22日
售价 392.70 元
说明 仅限5用户使用