上篇文章我们介绍了字符流,这节课我们讲文件流的第二类 - 字节流。讲文件操作时说过,字符流对应的是一般的文本字符,比如中文、英文、俄文都属于这类。字节流不一样,对应的是二进制文件,按照字节的方式进行读写。通过java文档可知,负责它的输入流的类叫做FileInputStream,实例化语句是
输入流对象fis可以进行读取文件内容的操作,初始化时接收一个参数,就是文件的类实例。
我们实践一下。在Eclipse里新建java项目FileByteRead –> 包com.test -> Test.java,我已经给大家准备好了bytePic.jpg。写如下程序:
FileInputStream有可能会抛异常,我们用个try…catch语句处理。根据java文档,我们讲两种比较常用的字符流读取方法,第一个是read()。用FileInputStream的对象每次调用read()都会按顺序读下一个字节的数据。怎么理解呢?picByte.jpg是个图片,是二进制文件,用文本打开是一堆乱码:
但即便是乱码,它也有长度,每一段数据也都有大小。调用一次read()就会按顺序返回下一个字节的数据,但不会直接返回,而是把这一字节的数据自动转成int。之前说过,byte和int都属于整型,byte就是字节,read()方法返回的值说白了就是把数据在byte和int之间进行类型转换。
读完文件最后一个字节的时候(如果最后剩下不到一个字节也没关系),如果这时你还调用read(),这个整型数值就会变成-1。
知道了用法,我们继续完善FileStreamInput类,用read()方法完成文件读取过程。
fis.read()方法返回的整型数值我用一个整型变量n存储。一开始n=0,第一次调用read()之后n的值就会改变,毕竟读了一个字节嘛。既然n=-1代表读完,那只要不等于1的情况都是在读,因此我就可以用一个while循环来控制读取过程,不是-1代表没读完,那就继续读。返回的n值由于是个整型数值,并不是我们想要的乱码,所以我们还得用个强制转换char c = (char) n强制转回来,这点挺讨厌。转换完再读下一个字节的数据,然后走循环再判断,如果满足条件继续读,如此往复,直到不满足条件证明已读完,跳出循环,程序结束。注意,换行符也会被打印,所以整个文档打印出来和你文档里的内容应该是一致的。
还有一点,不管是读还是写,文件流操作结束一定要关闭,否则非常浪费资源。关闭的方法是close(),而且关闭过程一定要在finally语句块里,代表不管有没有抛异常文件流都将强制关闭。
有些人说每次读一个字节太慢了,于是我们就有了第二个方法read(byte[] b)。它的工作原理也是从输入流中读字节,不过你可以指定每次读几个字节。它里面有个字节数组的参数,就是用来指定读多少个字节的。这个方法的意思就是假设有一个字节数组,每次把和这个数组空间等量的字节读进去。这时的返回值不再是某一个字节的整型数值,而是总共读到的字节数。比如我每次想读200个字节,那我可以声明一个200字节的数组,然后把数组作为参数传进去。够200就读200,能装满就装满,不够就能读多少读多少。我注意,方法每调用一次都会清空当前的字节数组,然后装下一次读取的字节。看我改写一下:
String line = new String(b, 0, n)这句代码中的0代表当前数组b中所有字节的第一个字节,而n值是实际读取字节的个数。再说一遍,这时的n值就不再是一个字节的int表现形式了,而是实际读取字节的个数。用整句代码表示把每次读出来的所有字节组成一个字符串打印。以此类推,一直打印出文件中全部的内容。n=-1时读取工作结束,跳出循环,程序结束。
有输入流就有输出流,也就是写的操作。负责字节流的输出流对象叫FileOutputStream,输入是input,输出就是output,很容易记。它的实例化语句是
前半部分其实和read()的演示没什么区别,只不过这回是每次读出来一个字节的数据后不直接打印出来,而是用fos.write(c)把它直接写到picByte.jpg里。如果你还是嫌慢,想每次读写多个字节那就用write(byte[] b, int offset, int len):
fos.write(b, 0, n)是把当前读入b数组的所有字节进行写入。0代表第一个字节,n代表字节的长度。这个方法对应read(byte[] b)这个方法。我每次读200个字节,然后把它们一起写到新文件里。需要注意的是,不管你用哪种写操作,必须在finally块中调用close()方法,否则文件内容写不进去。
以上两种写的方式都可以,但更推崇write(byte[] b),因为每次写一个会大大增加对磁盘的操作次数,次数多了就会影响它的寿命,甚至还有划坏的可能。而有了b数组就不一样了,它就好比一个装数据的缓存,每次读一个固定长度的字节数,比如例子里的200,每次装满了才一口气倒到硬盘里,以此来降低硬盘的压力。
这篇文章的源代码包括FileByteRead,FileByteReadCharBuffer,FileByteWrite,FileByteWriteCharBuffer四个项目,下篇我们讨论字节流的一个典型应用 - Excel文件的读写操作。
本篇知识点及注意事项:
1. 字节流和字符流不一样,字符流是一组字符组成的,而字节流是一堆二进制码组成的。
2. 字节流可以一个字节一个字节进行读写,也可以一次性读写一组字节。