最近使用POI处理excel文件,发现有一个很大的问题,poi对excel的日期格式的支持不太好,虽然HSSFCell中定义了基本的数据格式,但是浏览一圈后可以发现是没有date类型的,而poi在处理日期数据时将其视为double,即cell.CELL_TYPE_NUMERIC类型,这给我们解析excel文件带来了很大的困难。笔者在网上也找了一些解决的博客,但大多都显得繁琐,今天我介绍一种思路简单的排查bug和解决问题的方法。
首先我们来看一个excel的文件:
可以看到的是最后一列是一个日期格式的数据,现在已知该数据的行列分别为7和6,我们直接获取HSSFCell对象cell,下面是这次问题解决的关键思路,我们直接调用cell的toString()方法,看看会有什么结果,控制台输出如下:
我们可以看到,cell直接输出了一个代表日期的字符串,但是,并不是我们想要的格式。但是,想要把这个字符串变成我们想要的格式也很简单,下面直接给出代码:
* 转换非法的日期格式到指定的日期格式(转化为String)
* @param cell excel单元格(值类型为数字)
* @return 转化后的日期字符串
public String transferInvalidDateFormat(HSSFCell cell) {
* 读取cell的日期值,一般为:01-七月-1996等
String cellValue = cell.toString();
//获取天
String day = cellValue.substring(0, 2);
//获取月(这里使用cellValue.length() - 5是因为可能出现"七月"和"十一月"长度不一致的情况)
String month = cellValue.substring(3, cellValue.length() - 5);
//获取年
String year = cellValue.substring(cellValue.length() - 4, cellValue.length());
//把中文的月份转化为数字
switch (month) {
case "一月":
month = "01";
break;
case "二月":
month = "02";
break;
case "三月":
month = "03";
break;
case "四月":
month = "04";
break;
case "五月":
month = "05";
break;
case "六月":
month = "06";
break;
case "七月":
month = "07";
break;
case "八月":
month = "08";
break;
case "九月":
month = "09";
break;
case "十月":
month = "10";
break;
case "十一月":
month = "11";
break;
case "十二月":
month = "12";
break;
default:
break;
//按照"yyyy.mm.dd的格式拼接"
return new StringBuffer(year).append(".").append(month).append(".").append(day).toString();
通过这个方法,我们直接使用cell的toString()方法获取代表时间的字符串,然后对其进行处理获得年月日信息,之后就可以按照自己需要的格式进行拼接。
当然,在使用这个方法之前,我们需要对cell的类型进行判断,代码如下:
if (cell.getCellType() == cell.CELL_TYPE_NUMERIC) {
if (HSSFDateUtil.isCellDateFormatted(cell)) {
String dateValue = transferInvalidDateFormat(cell);
}
我们测试一下,还是刚才那个单元格,现在使用处理方法后控制台输出以下信息:
总结一下,有时候toString()也是一个调试Bug的好方法,大家可以大胆尝试一下~
POI
导出
Excel
时间
格式
和小数点
数据
的
处理
因为之前做了一个
Excel
导出功能,那个1.8的cell
我把它拉长的花就变成了1.799999,然后12月份变成了00。
后台过来的1.8是float 类型,我把它toString()或者就OK了,关于这个时间的花,CTMD,坑死了,昨晚花了一个大好的晚上去弄,本以为这个
bug
只需要花一丢丢时间就搞定,结果在家花了一大晚上
在
Excel
中
的
日期
格式
,其数值为距离1900年1月1日的天数,比如2016-9-2将其转化为数字
格式
时变成了42615,在用java
处理
的时候,读取的也将是42615。
在
POI
处理
Excel
中
的
日期
类型的单元格时,如果仅仅是判断它是否为
日期
类型的话,最终会以NUMERIC类型来
处理
。正确的
处理
方法
是先判断单元格的类型是否则NUMERIC类型,然后再判断单元格是否为
日期
格式
,如果是的话,
Excel
存储
日期
、时间均以数值类型进行存储,读取时先使用
POI
判断是否是数值类型,再进行进一步判断是否为
日期
,最后转化
1.纯数值
格式
:getNumericCellValue() 直接获取
数据
2.
日期
格式
:
处理
yyyy-MM-dd, d/m/yyyy h:mm, HH:mm 等不含文字的
日期
格式
1).判断是否是
日期
格式
:HSSFDateUtil.isCellDateFormatted(cell)
2).判断是
日期
或者时间
cell.getCellStyle().getDataFormat() == H
前不久写过一篇随笔《
EXCEL
解析之终极
方法
WorkbookFactory》,提到使用WorkbookFactory来
处理
Excel
文件
数据
,最近发现一个问题就是这个办法不能很好的
处理
各种
日期
格式
,比如下面这些:那么如何将这些
格式
正确识别并输出呢?下面来分享一下
解决
方法
。其实答案已经在之前已经写过。需要回到之前比较笨重的那个办法,就是在读取单元格时对单元格
中
数据
的种类做判断,再将
数据
做适当转换,P...
我们在使用
POI
导入的时候,时间往往是转换成了数值,而这个数值刚好是以一天24小时为单位计算的。
如果导入的是包含年的,则是从1900年这个原点,开始计算的天数。
如果是小时,则表达为这一天的百分比小数(根据小时)。
三.
解决
方法
:
// 将单元格的内容类型设置为字符串
row.getCell(6).setCellType(Cell.CELL_TYPE_STRING);
// 通过apache在HSSFDateUtil
private List rosolveFile(InputStream is, String suffix,
int startRow) throws IOException, FileNotFoundException {
开发过程
中
处理
Excel
导入功能,使用的
POI
工具类,在导入时把
日期
转换为指定
格式
的时候报异常,使用de
bug
查看发现导入
excel
的
日期
格式
竟然转成成了数值
格式
,不是通常的时间戳,是带小数点的数值。
需要通过以下代码
解决
,把数值转换成Java的时间类型,HSSFDateUtil是
POI
包下的一个类,使用getJavaDate
方法
把Double类型转换成Java
日期
类型
Date date = ...
case Cell.CELL_TYPE_NUMERIC: //数字
//遇到
日期
类型进行
格式
转换
if (HSSFDateUtil.isCellDateFormatted(cell)) {
poi
解析
excel
,可以获取当前解析的
数据
的类型。正常情况下我们可以在
excel
设置以下几种
数据
的类型
常量说明取值Cell.CELL_TYPE_NUMERIC数值类型cellValue.getNumberValue()Cell.CELL_TYPE_STRING字符串类型cellValue.getStringValue()Cell.CELL_TYPE_BOOLEAN布尔类型cellValue.g...
最近有客户用最新的
excel
格式
,即后缀为xlsx的
excel
做系统导入时出现
bug
,原来系统用来解析
excel
的的技术是jxl。jxl已经老早就不更新了不再支持
excel
后续版本的读写,没办法,只能用Apache的
poi
来实现。简单的使用百度一大堆,不需要我多写了,在开发的过程
中
遇到了些问题,就把
解决
方法
记录下来方便日后查看。为了同时兼容03、07及更高版本的
excel
。(恶心的是后缀是xlsx