Apache POI 之一:Excel文档的读取

Apache POI 是创建和维护操作各种符合Office Open XML(OOXML)标准和微软的OLE 2复合文档格式(OLE2)的Java API。用它可以使用Java读取和创建,修改MS Excel文件.而且,还可以使用Java读取和创建MS Word和MSPowerPoint文件。Apache POI 提供Java操作Excel解决方案(适用于Excel97-2008)。

前言:依赖或下载

<!-- poi 依赖 -->
<dependency>
   <groupId>org.apache.poi</groupId>
   <artifactId>poi</artifactId>
   <version>3.16</version>
</dependency>

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.16</version>
</dependency>

或者在poi.apache.org下载jar包

本篇文章主要是演示Excel文档的读取处理
使用POI解析Excel有两个需要注意的关键点:

  • 遍历方式的区别(PhysicalNumber和Number)
  • 单元格不同格式的读取

下面单独说明一下。

POI遍历方式的区别(PhysicalNumber和Number)

Excel文档结构分为整个文档(Workbook)、分页(Sheet)、行(Row)、单元格(Cell)四个类来描述,而遍历整个Excel也是通过层层遍历到单元格的方式,但是方式略有不同。如POI提供了获取行数的方法为getPhysicalNumberOfRows,而这里physical的含义就是去除了空行的数量,因此只有保证没有空行的情况下才能使用这个数量来遍历全部行。去除空行的遍历:

//行数
int rowNum=sheet.getPhysicalNumberOfRows();
if(rowNum<1) continue;

// 从第2(r=1)行取出,第一行默认为标题行
rowNum+=1;

//遍历
for(int r=1;r<rowNum;r++)
{
    Row row=sheet.getRow(r);
  
    //其他处理
}

但是,在下一层即遍历Cell单元格的时候如果还使用类似的getPhysicalNumberOfCells来获取数量遍历则可能出现错误,因为获取到的数量是去除了空格的单元格数量,而单元格的内容很可能是空的,所以这里就要使用一种可以遍历全部单元格的遍历方式:

// 循环取出每行的列数,其实是最后一列的列数
int cellNum=row.getLastCellNum();
// 遍历
for(int c=0;c<cellNum;c++)
{
    // 取出每列值
    Cell cell=row.getCell(c);
    
    //其他处理
}

单元格不同格式的读取

POI解析Cell的类型分为了字符串、数字、公式以及布尔四种类型:

  • 其中,字符串通过getRechStringCellValue().toString()来获取即可;
  • 而数字和公式在Excel中实际储存的都是Double类型;
  • 布尔类型直接通过getBooleanCellValue()获取。
  • 比较特殊是日期类型,日期类型实际cellType是数字,但是直接读取数字则不是想要的格式。为此,POI提供了一个方法(org.apache.poi.ss.usermodel.DateUtil.isCellDateFormatted(cell))来判断是否为日期,如果为日期格式则使用cell的getDateCellValue方法获取就可以得到Excel里格式化后的日期内容。

工具使用代码示例

(我这里的业务要求是只取部分需要的列里的值,而非全部列里的值导入。)

package pb.utils;

import org.apache.poi.ss.usermodel.*;

import java.io.File;
import java.util.*;

/**
 * Excel导入读取
 */
public class ExcelUtils
{
    /**
     * 动态解析Excel文件,并返回指定的对象列表
     *
     * @param excelFile
     * @param patternKey 匹配使用的主键名
     * @param pattern    全部匹配值
     * @param columnMap  需要获取的标题与字段名的对应,如显示名称->name;包含主键列
     * @return
     */
    public static Map<String,LinkedHashMap<String,Object>> resolveExcel(File excelFile,String patternKey,Set<String> pattern,Map<String,String> columnMap) throws Exception
    {
        //记录结果
        Map<String,LinkedHashMap<String,Object>> result=new HashMap<>();
        //载入文件
        Workbook workbook=WorkbookFactory.create(excelFile);

        //记录当前标题与列位置的映射
        Map<String,String> titleMap=new LinkedHashMap<>();

        //遍历所有Sheet页
        int pageNum=workbook.getNumberOfSheets();
        for(int page=0;page<pageNum;page++)
        {
            //获取Sheet
            Sheet sheet=workbook.getSheetAt(page);

            //遍历全部非空行
            Iterator<Row> rowItr=sheet.rowIterator();
            int rowNum=0;
            while(rowItr.hasNext())
            {
                //获取行
                Row row=rowItr.next();
                //记录数据
                LinkedHashMap<String,Object> map=new LinkedHashMap<>();

                //遍历本行全部列(包括空列)
                int colNum=row.getLastCellNum();
                for(int index=0;index<colNum;index++)
                {
                    //获取单元格
                    Cell cell=row.getCell(index);
                    //获取单元格内容
                    Object value=getCellValue(cell);

                    //第一行为标题行,记录标题和位置索引的映射
                    if(rowNum==0)
                    {
                        String title=value+"";
                        if(columnMap.containsKey(title))
                            titleMap.put(index+"",title);
                    }
                    //非标题行,根据指定columnMap和PatternKey查找记录
                    else
                    {
                        //需要的内容
                        if(!titleMap.containsKey(index+"")) continue;
                        map.put(columnMap.get(titleMap.get(index+"")),value);
                    }
                }

                //验证是否记录此行
                if(pattern.contains(map.get(patternKey)+""))
                {
                    result.put(map.get(patternKey)+"",map);
                }

                rowNum++;
            }
        }

        return result;
    }

    /**
     * 依据Excel中Cell类型读取不同的值
     *
     * @param cell
     * @return String/Double/Date/boolean/null
     */
    public static Object getCellValue(Cell cell)
    {
        Object result=null;

        //获取类型
        int type=cell.getCellType();
        //根据不同类型处理
        switch(type)
        {
            //字符串
            case Cell.CELL_TYPE_STRING:
            {
                result=cell.getRichStringCellValue().toString().trim();
                break;
            }
            //数字(Double)
            case Cell.CELL_TYPE_NUMERIC:
            //公式(Double)
            case Cell.CELL_TYPE_FORMULA:
            {
                //日期类型判断
                //日期类型
                if(org.apache.poi.ss.usermodel.DateUtil.isCellDateFormatted(cell))
                {
                    result=cell.getDateCellValue();
                }
                //普通数字
                else
                {
                    result=new Double(cell.getNumericCellValue());
                }
                break;
            }
            //布尔
            case Cell.CELL_TYPE_BOOLEAN:
            {
                result=cell.getBooleanCellValue();
                break;
            }
            //其他
            default:
        }

        return result;
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 206,214评论 6 481
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 88,307评论 2 382
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 152,543评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 55,221评论 1 279
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 64,224评论 5 371
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,007评论 1 284
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,313评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,956评论 0 259
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,441评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,925评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,018评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,685评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,234评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,240评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,464评论 1 261
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,467评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,762评论 2 345

推荐阅读更多精彩内容

  • 使用首先需要了解他的工作原理 1.POI结构与常用类 (1)创建Workbook和Sheet (2)创建单元格 (...
    长城ol阅读 8,402评论 2 25
  • 转自链接 目录 1.认识NPOI 2.使用NPOI生成xls文件 2.1创建基本内容 2.1.1创建Workboo...
    腿毛裤阅读 10,455评论 1 3
  • POI操作Excel Excel简介一个excel文件就是一个工作簿workbook,一个工作簿中可以创建多张工作...
    灰气球阅读 4,703评论 2 48
  • 实习第二周 No.2 项目功能里要求能够将展示的报表导出excel,因为报表的数据都是动态从list传进来的,所...
    苏筱筑阅读 2,333评论 2 7
  • Apache POI 是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Ja...
    玩味Orz阅读 2,604评论 0 0