注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

phperwuhan的博客

记载一个phper的历程!phperwuhan.blog.163.com

 
 
 

日志

 
 

如何用PHPExcel读取超大excel文件  

2014-12-25 11:09:44|  分类: php |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
来源:http://blog.sina.com.cn/s/blog_a0b1106901019ltl.html

工作中经常要遇到将xlsx文件中的部分内容导入到数据库。通常我们都是用PHPExcel来读取。

通过下面的方法我们可以很容易将一个excel表格读取成为php数组,之后就可以为所欲为了:

  1. $input_file "data.xlsx"
  2. $objPHPExcel PHPExcel_IOFactory::load($input_file); 
  3. $sheetData $objPHPExcel->getSheet(0)->toArray(null, true, true, true); 

如果文章到此结束,那价值就不大了。

很不幸的情况总是存在的,当data.xlsx有上万行,每一行又有很多列,每一列又有很长的字符串,并且有的还有颜色等效果时,用上面的方法经常发生的情况就是内存不足。

好吧,我们还有ini_set来加大内存,还可以用set_time_limit来设置较长的超时,如下:

  1. set_time_limit(90); 
  2. ini_set("memory_limit", "1024M"); 
  3. $input_file "data.xlsx"
  4. $objPHPExcel PHPExcel_IOFactory::load($input_file); 
  5. $sheetData $objPHPExcel->getSheet(0)->toArray(null, true, true, true); 

但很负责任的说,这些都不是终极的方案。

我曾经试过将内存设置到了2G,超时设置到了90秒,也仍然读不出一个4000行的花花绿绿的表格。原因都出在toArray这个方法上,它会将处理的结果全保存到数组中,这种方式在处理简单表格时还是很方便的,但在处理大表格时,真的是很杯具。

我们的解决方案如下:

  1. require 'lib/PHPExcel.php'; 
  2.  
  3. set_time_limit(90); 
  4. $input_file "data.xlsx"
  5. $objPHPExcel PHPExcel_IOFactory::load($input_file); 
  6.  
  7. // 读取规则 
  8. $sheet_read_arr array(); 
  9. $sheet_read_arr["sheet1"] array("A","B","C","D","F"); 
  10. $sheet_read_arr["sheet2"] array("A","B","C","D","F"); 
  11.  
  12. // 循环所有的页 
  13. foreach ($sheet_read_arr as $key => $val) 
  14.     $currentSheet $objPHPExcel->getSheetByName($key);// 通过页名称取得当前页 
  15.     $row_num $currentSheet->getHighestRow();// 当前页行数 
  16.  
  17.     // 循环从第二行开始,第一行往往是表头 
  18.     for ($i 2$i <</span>$row_num; $i++) 
  19.     
  20.         $cell_values array(); 
  21.         foreach ($val as $cell_val) 
  22.         
  23.             $address $cell_val $i;// 单元格坐标 
  24.  
  25.             // 读取单元格内容 
  26.             $cell_values[] $currentSheet->getCell($address)->getFormattedValue(); 
  27.         
  28.  
  29.         // 看看数据 
  30.         print_r($cell_values); 
  31.     

上面的方式算是较复杂的情况了,如果只是想将所有的单元格全读出来,用下面的方法就行了:

  1. require 'lib/PHPExcel.php'; 
  2.  
  3. set_time_limit(90); 
  4. $input_file "data.xlsx"
  5. $objPHPExcel PHPExcel_IOFactory::load($input_file); 
  6.  
  7. $sheet_count $objPHPExcel->getSheetCount(); 
  8. for ($s 0$s <</span> $sheet_count; $s++) 
  9.     $currentSheet $objPHPExcel->getSheet($s);// 当前页 
  10.     $row_num $currentSheet->getHighestRow();// 当前页行数 
  11.     $col_max $currentSheet->getHighestColumn(); // 当前页最大列号 
  12.  
  13.     // 循环从第二行开始,第一行往往是表头 
  14.     for($i 2$i <</span>$row_num; $i++) 
  15.     
  16.         $cell_values array(); 
  17.         for($j 'A'$j <</span> $col_max; $j++) 
  18.         
  19.             $address $j $i; // 单元格坐标 
  20.             $cell_values[] $currentSheet->getCell($address)->getFormattedValue(); 
  21.         
  22.  
  23.         // 看看数据 
  24.         print_r($cell_values); 
  25.     

我们可以将上面的print_r地方改成组拼sql语句并写入文件,然后用mysql导入,当然也可以直接连接数据库向表中插入记录,这就随意了。

用这种方法可以将上万行的记录很轻松的导入到表中,希望对大家有所帮助。

  评论这张
 
阅读(441)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017