如何使用PHPExcel高效导入Excel数据至数据库?
- 内容介绍
- 文章标签
- 相关推荐
本文共计980个文字,预计阅读时间需要4分钟。
PHPExcel已停止维护,请勿在PHP 7.4及所有新项目中使用它。不应再使用它。滥用会导致致命错误、日期解析错误、内存损坏,甚至上传恶意Excel文件触反序列化漏洞。目前唯一可信赖的方案是PhpSpreadsheet。
为什么 PhpSpreadsheet 是唯一可行选择
PHPExcel 最后一次更新是 2015 年,不兼容 PHP 8.0+,且存在已知内存泄漏(尤其处理合并单元格或公式时)。而 PhpSpreadsheet 是其官方继任者,持续维护至今,支持 PHP 7.4–8.3,纯 PHP 实现,无扩展依赖。
-
PHPExcel的PHPExcel_IOFactory::load()在 PHP 8.1+ 直接报Fatal error: Uncaught Error: Call to undefined method - 旧项目若仍跑在 PHP 7.2 或更低版本,也建议尽快升级——
PhpSpreadsheet的最低要求是 PHP 7.4 - 如果你看到文档里还写
require 'Classes/PHPExcel.php',那基本是过期教程,别照抄
读取大 Excel 文件时内存爆掉怎么办
直接 IOFactory::load() 一个 10MB 的 .xlsx,可能吃掉 500MB 内存。原因:默认加载样式、字体、公式、合并单元格元数据——而你入库只需要数值。
- 必须提前设置
$reader->setReadDataOnly(true),跳过所有非数据内容 - 不要用
$worksheet->toArray()一把梭,它会把几万行空行全读进内存 - 改用流式遍历:
getRowIterator()+getCellIterator(),边读边处理 - 上传前校验文件类型,别让
$_FILES['file']['tmp_name']直接进load()—— 传个.txt重命名为.xlsx就抛Could not open ... for reading! File does not exist.
日期变成 44562、数字变科学计数、中文列名映射错位
这些不是编码问题,是单元格类型和取值方式没对上。Excel 内部用序列号存日期,getValue() 返回的是原始类型值,不是显示值。
立即学习“PHP免费学习笔记(深入)”;
- 要拿到 “2022-01-01” 这种格式,必须用
$cell->getFormattedValue(),不是getValue() - 数字列如果被 Excel 自动识别为 numeric 类型,
getValue()可能返回 float,导致插入 MySQL 时精度丢失;用(string) $cell->getFormattedValue()更稳 - 硬编码列索引(如
$rowData[0])极危险:用户多插一列、隐藏列、调换顺序,数据就全插错字段。正确做法是先读首行构建映射:$header = $worksheet->rangeToArray('A1:'.$columnLetters[$highestColumn].'1')[0]; $columnMap = array_flip(array_map('trim', $header)); - 空单元格返回
null,但有些模板填了空格或,统一判空要用trim((string)$cell->getValue()) === ''
事务批量插入前,最容易漏掉的三件事
很多人只顾读取,忘了入库环节的容错设计,结果一条脏数据卡住整批导入。
- 每行数据必须做字段映射后提取,不能靠数组下标硬塞 ——
$data['email'] = $rowData[$columnMap['邮箱']] ?? '' - 邮箱、手机号、日期字段要提前清洗:
filter_var($email, FILTER_VALIDATE_EMAIL)、DateTime::createFromFormat()校验 - 数据库插入必须包在事务里,且设好
PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION;一旦某行失败,整个批次回滚,避免部分写入
真正难的不是“怎么读”,而是“怎么让读出来的每一行都可验证、可追溯、可丢弃”。很多线上事故,都出在跳过表头判断、忽略空行检测、没做字段映射这三步上。
本文共计980个文字,预计阅读时间需要4分钟。
PHPExcel已停止维护,请勿在PHP 7.4及所有新项目中使用它。不应再使用它。滥用会导致致命错误、日期解析错误、内存损坏,甚至上传恶意Excel文件触反序列化漏洞。目前唯一可信赖的方案是PhpSpreadsheet。
为什么 PhpSpreadsheet 是唯一可行选择
PHPExcel 最后一次更新是 2015 年,不兼容 PHP 8.0+,且存在已知内存泄漏(尤其处理合并单元格或公式时)。而 PhpSpreadsheet 是其官方继任者,持续维护至今,支持 PHP 7.4–8.3,纯 PHP 实现,无扩展依赖。
-
PHPExcel的PHPExcel_IOFactory::load()在 PHP 8.1+ 直接报Fatal error: Uncaught Error: Call to undefined method - 旧项目若仍跑在 PHP 7.2 或更低版本,也建议尽快升级——
PhpSpreadsheet的最低要求是 PHP 7.4 - 如果你看到文档里还写
require 'Classes/PHPExcel.php',那基本是过期教程,别照抄
读取大 Excel 文件时内存爆掉怎么办
直接 IOFactory::load() 一个 10MB 的 .xlsx,可能吃掉 500MB 内存。原因:默认加载样式、字体、公式、合并单元格元数据——而你入库只需要数值。
- 必须提前设置
$reader->setReadDataOnly(true),跳过所有非数据内容 - 不要用
$worksheet->toArray()一把梭,它会把几万行空行全读进内存 - 改用流式遍历:
getRowIterator()+getCellIterator(),边读边处理 - 上传前校验文件类型,别让
$_FILES['file']['tmp_name']直接进load()—— 传个.txt重命名为.xlsx就抛Could not open ... for reading! File does not exist.
日期变成 44562、数字变科学计数、中文列名映射错位
这些不是编码问题,是单元格类型和取值方式没对上。Excel 内部用序列号存日期,getValue() 返回的是原始类型值,不是显示值。
立即学习“PHP免费学习笔记(深入)”;
- 要拿到 “2022-01-01” 这种格式,必须用
$cell->getFormattedValue(),不是getValue() - 数字列如果被 Excel 自动识别为 numeric 类型,
getValue()可能返回 float,导致插入 MySQL 时精度丢失;用(string) $cell->getFormattedValue()更稳 - 硬编码列索引(如
$rowData[0])极危险:用户多插一列、隐藏列、调换顺序,数据就全插错字段。正确做法是先读首行构建映射:$header = $worksheet->rangeToArray('A1:'.$columnLetters[$highestColumn].'1')[0]; $columnMap = array_flip(array_map('trim', $header)); - 空单元格返回
null,但有些模板填了空格或,统一判空要用trim((string)$cell->getValue()) === ''
事务批量插入前,最容易漏掉的三件事
很多人只顾读取,忘了入库环节的容错设计,结果一条脏数据卡住整批导入。
- 每行数据必须做字段映射后提取,不能靠数组下标硬塞 ——
$data['email'] = $rowData[$columnMap['邮箱']] ?? '' - 邮箱、手机号、日期字段要提前清洗:
filter_var($email, FILTER_VALIDATE_EMAIL)、DateTime::createFromFormat()校验 - 数据库插入必须包在事务里,且设好
PDO::ATTR_ERRMODE => PDO::ERRMODE_EXCEPTION;一旦某行失败,整个批次回滚,避免部分写入
真正难的不是“怎么读”,而是“怎么让读出来的每一行都可验证、可追溯、可丢弃”。很多线上事故,都出在跳过表头判断、忽略空行检测、没做字段映射这三步上。

