上两篇文章我们讨论了文件(夹)操作、字节流、字符流操作,这篇文章介绍一个特殊的文件操作,就是Excel。想必大家都用过Excel文件,不管是做图表也好,归纳数据也罢,Excel都是很方便的一个工具。即便是现在,我发现很多公司也还是愿意把test case写在Excel里,因为它一目了然,太好用了。自动化测试的时候测试员往往会把测试数据写到Excel文件中,执行代码时把数据作为参数读入,所以我们对Excel的操作要有个大概的了解。
就像我们之前学的java.lang类库/API,它里面的字符串模块就包含了很多关于字符串的方法,你直接调用它们就好。
但是,并不是所有的类库都在下载的jdk里,因为有些是第三方公司开发的,需要另外下载。Excel这个模块就是属于此例,它属于Apache公司开发的POI类库,这个类库专门为了微软的文档操作设计的:
请自行去官网下最新版。你会发现它里面全是jar包,我新建个项目演示一下怎么使用它们。新建ExcelRead-> com.test package -> Test.java,然后在项目名称ExcelRead上右击 -> Build Path -> Configure Build Page,会看到如下:
按图上指示,在library选项卡下点击Add External Library,然后把图里标明的三个地方的jar包全添加进去。最后项目截图如下:
Excel是二进制文件,所以要遵循字节流的输入输出方式。先把下面代码填上,看不太懂的朋友请回到字节流那篇复习一下:
test.xlsx就是我创建的一个Excel文件。Excel文件有两种后缀名,一种是Excel 97-2003的.xls,还一种是Excel 2007的.xlsx。POI对它们也是区别对待,先来看.xlsx的操作:
一个完整的Excel文件叫作一个工作簿,英文是Workbook,POI也用同一个名称命名它,只不过Workbook是个接口,不是类。WorkBook实例化对象的方式是:
XSSFWorkbook指的就是Excel 2007的对象,实现Workbook接口。XSSFWorkbook里面的参数就是字节流对象,可以是读,也可以是写。每一个Workbook里会有很多个工作表,英文叫Sheet,POI也用同一个名称命名它的接口,一个Sheet接口的对象是通过Workbook对象调用getSheet()方法得到的:
里面的参数就是Sheet的名称。通过Sheet对象我们可以得到某一行的数据,Excel用Row接口来代表行:
i的值就是行数,Excel和数组一样,第一行用0表示。比如如下Excel文件:
每一行返回的row值就是一整行两个格(cell)的数据:
拿到每一行的数据后接连调用getCell()和getStringCellValue()方法就可以取得每个格的值:
j表示当前行的值得位置,比如我们取到的第一行是"EmpCode Password",j=0时取到的是"EmpCode",j=1时取到的是"Password"。按照以上这些讲解,我们就可以接着往下写一个读Excel文件的小程序:
一行一行解释一下。第18行wb是Workbook接口的引用变量,接着通过Sheet sheet = wb.getSheet("login")得到sheet。“login”是sheet的名称,这两步标志这Excel文件操作的开始,不能省。要想读取每一行的值,想也能想到要用循环。但要循环就得知道总行数。第26行sheet.getLastRowNum()得到的是最后一行,由于Excel第一行从0开始,所以我们例子中得到的值是3:
因为还得包含"EmpCode | Password"这个标题,还要再加一行,所以rowCount的值加上1变成4。你看,Excel数据的格式是不是像极了二维数组?所以我们可以用嵌套的for循环读取每一个值。循环从28行开始,通过sheet.getRow(i)得到每一行,然后内循环取得当前行每一个格里的值。最后别忘了关闭文件流。打印出来的结果就是:
这就是Excel输入流的完整操作。现在说说输出流,也就是写操作。首先,要想把一个值写到Excel中,你先得知道写到哪行吧?读一行用的方法是Row row = sheet.getRow(i),但写机制不一样,写的时候要创建新行与新列,然后再把值加到列中,最后通过输出流写到文件中。这点不太好理解,有些人说Excel行和列不都已经提前存在了吗?为什么要再创建呢?注意,这里创建的行与列指的是在内存里,和Excel没什么关系,填值过程也是在内存里,只有最后的写操作是写到文件里。没懂不要紧,先看程序:
再创建一个新的java项目叫ExcelWrite,里面有个叫com.test的包以及一个Test.java文件。除此之外我还有一个叫test.xlsx的文件。和ExcelRead不同,ExcelWrite里的test.xlsx是空的。现在我的目标是把两个值1004和101112写到第一行前两列:
要放入的两个值写到一个叫str的数组里,这步在第22行。其中有一行代码Row row = sheet.createRow(0)代表的就是我刚才说的写操作需要创建一行,因为下标为0代表第一行,所以我写0。注意,0暂时仅仅代表Excel里的一个位置,row并不是在文件中创建的,而是内存中,只不过现在锁定了Excel文件中第一行前两个格。就好比是row跟文件说“嘿,哥们儿,我先预定了这个位置哈。”:
同理,36行和37行循环中我写Cell cell = row.createCell(j)和cell.setCellValue(str[j])是为了在这一行创建列并在里面赋值。因为有两列,所以循环时j = 0和1:
此时只是给cell赋值了,还是没写到文件里。接着实例化输出流对象fos,再用write()方法把内存中创建好的行和列一股脑写到文件里:
这就是.xlsx的读写。再简单说说.xls。两者的主要区别在于Workbook的声明和实例化上,别的都差不多。实现.xls接口的类叫HSSWorkbook,格式如下:
.xlsx对应的类是XSSFWorkbook,.xls对应的是HSSFWorkbook,两个别搞混。以上就是Excel的操作,源代码在ExcelRead和ExcelWrite两个项目里。