今天,准备用nodejs
的request
模块去爬取需要的图片,在存储图片的时候遇到了一个问题:
由于存储图片的文件夹可能不存在,所以需要先用
fs.stat
方法判断文件夹是否存在。但是,这里是个异步操作,也就是由于这个判断,输出的图片始终没有数据。大小size
是0
具体的情形可以用下面的代码来描述
let fs = require("fs");
let path = require("path");
let request = require("request");
let url = "http://127.0.0.1:9999/20140901163412_2GL54.jpeg";
let write1 = fs.createWriteStream(path.join(__dirname, "Test1.jpeg"));
let write2 = fs.createWriteStream(path.join(__dirname, "Test2.jpeg"));
let write3 = fs.createWriteStream(path.join(__dirname, "Test3.jpeg"));
let write4 = fs.createWriteStream(path.join(__dirname, "Test4.jpeg"));
// // 能够输出正确的图片
request(url)
.on("response", (res) => {
res.pipe(write1);
});
// 不定时能输出正确的图片
request(url)
.on("response", (res) => {
setTimeout(() => {
res.pipe(write2);
}, 0);
});
// 不能输出正确的图片
request(url)
.on("response", (res) => {
setTimeout(() => {
res.pipe(write3);
}, 10)
});
// 不能输出正确的图片
request(url)
.on("response", (res) => {
setTimeout(() => {
res.pipe(write4);
}, 20)
});
setTimeout
简单的再现了异步的情形,在这里,Test1.jpeg
能够正常显示,Test2.jpeg
、Test3.jpeg
、Test4.jpeg
却不行,大小是0
;
到这里我想,大概是两个原因导致的:
-
response
对象本身有什么机制 -
流
本身的机制
为了验证我的想法,我重新做了个实验,不过略有不同:
let fs = require("fs");
let path = require("path");
let _read = fs.createReadStream(path.join(__dirname, "./20140901163412_2GL54.jpeg"));
let _write1 = fs.createWriteStream(path.join(__dirname, "./_Test1.jpeg"));
let _write2 = fs.createWriteStream(path.join(__dirname, "./_Test2.jpeg"));
let _write3 = fs.createWriteStream(path.join(__dirname, "./_Test3.jpeg"));
let _write4 = fs.createWriteStream(path.join(__dirname, "./_Test4.jpeg"));
// 正确显示
_read.pipe(_write1);
// 正确显示
setTimeout(() => {
_read.pipe(_write2);
}, 0);
// 无法显示
setTimeout(() => {
_read.pipe(_write3);
}, 10)
// 无法显示
setTimeout(() => {
_read.pipe(_write4);
}, 20)
如上所示,一共有四个写入流, 大体的情况和上面的response
类似,但是,这里的setTimeout
是0
的时候能够正确下载的,这就有点让我糊涂了:
1. 无法正常下载的确和异步有关系
2. 为什么setTimout = 0
的情况下,一个能够正确下载,一个无法确定能不能正确下载?
process.nextTick setTimeout setImmediate
在例子1
中,setTimeout
为0
的时候,并不能正确的下载图片,于是,我想起,在nodejs
中其实一共有三种异步的方式的,他们分别是process.nextTick
、setImmediate
、setTimeout
,他们分别对应不同的观察者模式:idle观察者
,check观察者
,io观察者
,他们的优先级顺序如下:idle
> io
> check
,不同的地方在于,process.nextTick
其实是以数组的形式存在着的,就有点类似于强制插入的感觉,setImmediate
和setTimeout
其实差不多,不过,setTimeout
好像有一点点的不同,那就是setTimeout(fn,0)
在底层其实是以setTimeout(fn,1)
运行的。setImmediate
和setTimeout
谁先谁后没有确定性。
于是乎,我对第一个测试的代码的setTimeout(fn,0)
分别又以setImmediate
,process.nextTick
分别尝试了下,本想着应该都是出不来的,但是,奇怪的是,process.nextTick
竟然成功了。