个人笔记-java解析文本并转换生成Excel文件


本篇要点:
1、文件读写的基本操作
2、字符串分割
3、POI生成Excel文件(.xlsx)

需求:
将csv格式的数据文件的内容导入到表格中,生成xlsx格式的文件。
(这是个很简单的任务,这里记录一下,以便以后复用代码。)
转换前:

csv格式文件样例

转换后:

转换后的xlsx文件

起因:

思路:

整体思路

1、按行读取文件数据,过滤掉不必要的行。
2、有效行进行数据分割。
3、分割好的数据存入表格的单元格。
4、输出生成xlsx文件。

用记事本打开csv文件分析一下,发现需要解决的问题主要有:

1、开头有多余代码


开头多余代码

2、有重复的标题行,每行末尾有无效数据(,,,,)

无效数据

读取行的详细思路

1、正则匹配“+”开头的行(称为“+”行)并计数,只有读取“+”行计数为1时,置布尔值title_read为true,表示下一行可以读取为标题行。
2、当“+”行计数>=1时,读取的非“+”行才是有效行,这样就可以忽略开头代码。
3、当“+”行计数!=1时,置title_read为false,表示之后不再读取标题行。无效标题行的判断条件为title_read为false时“+”行计数为基数(因为每个标题行前后都有一行“+”行)。这样就可以忽略掉多余标题行。
4、进行字符串切割后,不输出第一个(第一个“|”前是空字符串)和最后一个切割数据(“,,,,,”无效数据)。

完整代码

因为这是个人笔记,就不细讲每一步的实现了,代码比较简单,细节见注释。

package excelOP;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;

import org.apache.poi.xssf.streaming.SXSSFRow;
import org.apache.poi.xssf.streaming.SXSSFSheet;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;

public class ExcelOp {
    
    public void trans(String file_in,String file_out//参数file_in,file_out分别为输入文件路径和输出文件路径
            ){
        /*实例化输入、输出流*/
        File f_in=new File(file_in);//输入文件
        FileInputStream ips=null;
        InputStreamReader ipsr=null;
        
        File f_out=new File(file_out);//输出文件
        FileOutputStream ops=null;
        try {
            ips=new FileInputStream(f_in);
            ipsr=new InputStreamReader(ips);
            
            ops=new FileOutputStream(f_out);
        } catch (FileNotFoundException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }
        
        /*创建excel表格文件并输出*/
        //创建工作薄
        SXSSFWorkbook wb = new SXSSFWorkbook();
        try {
            //创建新的一页
            SXSSFSheet sheet = wb.createSheet("new sheet");
            
            BufferedReader br=new BufferedReader(ipsr);
            int count_title_framelines=0;
            boolean title_read=false;
            String valueString = null;
            
            int count_line=0;//表格的有效行计数
            
            while ((valueString=br.readLine())!=null){//循环处理每一行
                if(valueString.matches("\\+.+")){//正则匹配标题前后行“+”开头的行
                    count_title_framelines++;
                    if(count_title_framelines==1)title_read=true;
                    else title_read=false;
                }
                else{//非“+”开头的行
                    if(!(title_read==false&&count_title_framelines%2==1)//忽略重复标题行
                            &&count_title_framelines>=1){//忽略开头代码
                        
                        //分解每一行有效行
                        String[] strs_cell=valueString.split("\\|");//用“|”切割每一行作为一个单元格数据
                        SXSSFRow row = sheet.createRow((short)count_line);
                        for(int i=1;i<strs_cell.length-1;++i){//循环每个切割得到的数据,除了最后一个(,,,)和第一个(空)
                            //创建要显示的内容,创建一个单元格,第一个参数为列坐标,第二个参数为行坐标,第三个参数为内容
                            row.createCell((short)i-1).setCellValue(strs_cell[i]);
                            System.out.println("正在导入第"+count_line+"行……");
                        }
                        count_line++;
                    }
                }
            }
            //把创建的表格写入到输出流中,并关闭输出流
            wb.write(ops);
        }catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        }finally {
            if(wb!=null){
                try {
                    wb.close();
                    System.out.println("写入表格完毕!");
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            if(ips!=null){
                try {
                    ips.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
            if(ops!=null){
                try {
                    ops.close();
                } catch (IOException e) {
                    // TODO Auto-generated catch block
                    e.printStackTrace();
                }
            }
        }
        
    }
    public static void main(String[] args) {
        // TODO Auto-generated method stub
        ExcelOp exop=new ExcelOp();
        exop.trans("Ngap.csv", "test.xlsx");
    }

}

参考:

POI操作Excel常用方法总结
注:这篇主要讲的是用HSSF生成xls格式的文件(Excel2003版之前用的格式),生成xlsx用的是SXSSF,如上个部分的代码。不过相应的操作大同小异,把所有的“HSSF”改成“SXSSF”即可,相应的包可以到Apache官网下载,给个链接:Apache POI - Download Release Artifacts

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 199,830评论 5 468
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 83,992评论 2 376
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 146,875评论 0 331
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 53,837评论 1 271
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 62,734评论 5 360
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,091评论 1 277
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,550评论 3 390
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,217评论 0 254
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,368评论 1 294
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,298评论 2 317
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,350评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,027评论 3 315
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,623评论 3 303
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,706评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,940评论 1 255
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,349评论 2 346
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 41,936评论 2 341

推荐阅读更多精彩内容

  • 使用首先需要了解他的工作原理 1.POI结构与常用类 (1)创建Workbook和Sheet (2)创建单元格 (...
    长城ol阅读 8,392评论 2 25
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,566评论 18 139
  • 我父母是一对特别爱玩的人,洒脱,自由,我八岁的时候就带我骑车去中俄边境线,来回骑了一个月,晒的比当地放羊的内蒙古人...
    绿山墙的Echo阅读 1,506评论 6 8
  • 阳光高照霜消失,零度凉爽穿厚衣 还是熟人在练功,我还坚持来跑步 一点出发练单杠,两点和朋友去歌厅 今天空气好,中午...
    荣兰_a5f9阅读 171评论 0 0
  • 大城市人口多,发展的机遇相对大一点,提供的机会多一点,相对于小城市来说这三点是必备的。 最近都在选实习的地方,也倾...
    雨晴T阅读 255评论 2 0