使用Python快速合并大量电子表格的方法
近日,淮南市审计局在开展某项审计调查工作时,除现场实地走访之外,还采用问卷调查方式,对全市范围内该行业的数百家各级机构进行调查了解。为做到全面细致,每份调查表涉及到管理和应用等方面的21个业务系统、437个功能项,以电子表格形式发放并回收。对回收到的数百个电子表格文件,审计人员必须全面查阅并统计分析,如果按照常规方式逐个打开文件或手工合并,需要耗费大量时间并且极易出错。这时利用Python进行处理不失为一种好方法,做好准备工作后数秒内即可生成合并表格。
日常处理少量表格时,可以在Excel或WPS中人工复制粘贴到新表格,但在处理大量表格时显然耗时耗力。这时使用Python只需要少量代码即可轻松完成任务,特别是当工作重复度很高的时候,只要略微改动代码即可,可以大大提高工作效率。在数据分析处理方面,Python有很完备的生态环境,这里以合并大量同样表头结构的电子表格文件为例,简要介绍Python的使用。
首先需要安装Python环境以运行Python程序,再选择安装一个Python编辑器环境,除使用Python自带的IDLE以外,可以安装一个功能强大的代码编辑器比如PyCharm,使用更丰富的支持库以带来更好的编程体验。
具体操作时,先将要合并的所有电子表格文件存放在同一个文件夹中,在Python代码中设置原始路径,再指定合并后的工作表和工作薄名称。代码使用xlsxwriter等模块,对每个工作表和工作薄逐个循环,读取单元格内容写入到新工作表的新工作薄。运行代码后即可迅速生后合并结果,具体代码和运行情况如下:
经过上述操作,指定文件夹中的所有电子表格文件已经生成一个合并文件,这时对合并后的文件进行筛选或统计分析就方便多了。
该方法具有较强的通用性,审计人员日常需要面对大量的电子表格,无论是分年月、分部门或分县区的财务及业务数据,或者是日常汇总人员、工资及各类台账等表格数据,只要是相同表头的同类文件均可适用。