Taoin - 简书

发简信

Taoin

1
关注
1
粉丝
22
文章
2012

字数
1

收获喜欢
0

总资产

IP属地：安徽

Taoin

现在是用不了吗。看xpath都不对里

爬取某吧的帖子及各帖子所有回复的内容
这个程序有借鉴别人的代码：效果图：

噫树
1160 2 0
Taoin

程序报ssl证书错误
ssl._create_default_https_context = ssl._create_unverified_context

187 0 0

Taoin

python一行一行读取
使用readline()读文件 f = open("hi.txt",encoding='utf-8')while True:line = f.readline()if lin...

615 0 0
Taoin

正则表达式

119 0 0
Taoin

scrapy中间件User-Agent
https://cloud.tencent.com/developer/article/1382045[https://cloud.tencent.com/developer...

198 0 0
Taoin

xpath匹配
和。 footer前后都有字符的时候，我们可以使用 XPath 的关键词contains：//div[contains(@class, "footer")] 忽略大小写，在...

822 0 0
Taoin

json文件有重复value的解决办法

467 0 0

Taoin

Linux常用命令
pwd：显示当前目录 cd：进入目录 ls：显示当前路径文件 cp：拷贝文件 mv：移动文件 rm：删除文件 rmdir：删除文件夹 cat：查看文件内容（小文件） less...

173 0 0
Taoin

scrapy-redis中settings基本参数
DUPEFILTER_CLASS: 设置重复过滤器模块 SCHEDULER:设置调度器 SCHEDULER_PERSIST=True:设置当爬虫结束时的时候是否保持redis...

321 0 0
Taoin

TCP的三次握手与四次挥手
TCP连接建立阶段：第一次握手：客户端的应用进程主动打开，并向客户端发出请求报文段。其首部中：SYN=1,seq=x。第二次握手：服务器应用进程被动打开。若同意客户端的请...

230 0 0
Taoin

Python3 获取一大段文本之间两个关键字之间的内容方法
import re #文本所在TXT文件 file = '123.txt' #关键字1,2(修改引号间的内容) w1 = '123' w2 = '456' f = open(...

532 0 1
Taoin

正则匹配两个字符之间所有文本
# coding=utf-8 import re # 匹配两个字符中间的所有字符 a ='life is short, i use pythoni love it' r = ...

958 0 0

Taoin

scrapy关于.xpath中的normalize-space()的理解
若div为当前节点，使用.xpath('//div//text()').extract()开头或者结尾会有\r\n\t。使用 .xpath('normalize-space...

874 0 0
Taoin

scrapy保存
#初始化方法 def __init__(self): self.f=open('yunbtv.json','a') def process_item(self, item...

253 0 0
Taoin

scrapy meta参数的使用
def parse_detail(self, response): yunbtv=response.meta['item'] yunbtv['info']=response....

817 0 0
Taoin

scrapy翻页
part_url=response.xpath('').extract_first() if part_url!='javascripr:void(0)': next_u...

230 0 0
Taoin

scrapy使用selenium
from seleniumimport webdriver from scrapy.httpimport HtmlResponse class JavaScriptMiddl...

182 0 0

Taoin

scrapy 模拟登录
1.重写scrapy中start_requests方法 def start——requests(self): url=self.start_urls[0] temp=...

130 0 0
Taoin

scrapy 存入数据库
class InformationjectPipeline: def open_spider(self,spider): self.conn=pymysql.connect(...

245 0 0
Taoin

scrapy框架爬取数据并写入数据库
写入两个数据库，如果需要一个，按照其中一个执行就可以：①、MongoDB②、Mysql 一、创建数据库 1、使用虚拟机安装centos7，并安装docker（百度有教程）2、...

HCZd
3705 1 2

暂无个人介绍