如何用Python批量将Word文档转换成特定格式的Excel文件?
- 内容介绍
- 文章标签
- 相关推荐
本文共计5580个文字,预计阅读时间需要23分钟。
支持按文件夹批量处理文件,也可单独处理一个文件,并可以自定义标识符。最近开发了一个答题类小程序,到了录入试题进行测试的时候,发现试题都是word文档。
支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符
最近在开发一个答题类的小程序,到了录入试题进行测试的时候了,发现一个问题,试题都是word文档格式的,每份有100题左右,拿到的第一份试题,光是段落数目就有800个。而且可能有几十份这样的试题。
而word文档是没有固定格式的,想批量录入关系型数据库mysql,必须先转成excel文档。这个如果是手动一个个粘贴到excel表格,那就头大了。
我最终需要的excel文档结构是这样的:每道题独立占1行,每1列是这道题的一项内容,大概就是问题、选项A、选项B等等。
但word文档是这种结构,如果按照网上通用的方式去转,基本上你得到的结果就是一大坨文字都在一格里,根本不符合需求。
最后我想到了一个解决思路,可以实现这个需求,先看看我转出来的结果:
这个格式虽然跟最终的有点差别,但是只要在excel文档或者在代码里稍微再修改一下,就能完全符合要求了。
废话少说,先贴出代码,看得懂的可以直接拿去用,看不懂的,可以看我后面的具体说明。
已经把它封装成通用脚本了,你可以直接调用。
本文共计5580个文字,预计阅读时间需要23分钟。
支持按文件夹批量处理文件,也可单独处理一个文件,并可以自定义标识符。最近开发了一个答题类小程序,到了录入试题进行测试的时候,发现试题都是word文档。
支持按照文件夹去批量处理,也可以单独一个文件进行处理,并且可以自定义标识符
最近在开发一个答题类的小程序,到了录入试题进行测试的时候了,发现一个问题,试题都是word文档格式的,每份有100题左右,拿到的第一份试题,光是段落数目就有800个。而且可能有几十份这样的试题。
而word文档是没有固定格式的,想批量录入关系型数据库mysql,必须先转成excel文档。这个如果是手动一个个粘贴到excel表格,那就头大了。
我最终需要的excel文档结构是这样的:每道题独立占1行,每1列是这道题的一项内容,大概就是问题、选项A、选项B等等。
但word文档是这种结构,如果按照网上通用的方式去转,基本上你得到的结果就是一大坨文字都在一格里,根本不符合需求。
最后我想到了一个解决思路,可以实现这个需求,先看看我转出来的结果:
这个格式虽然跟最终的有点差别,但是只要在excel文档或者在代码里稍微再修改一下,就能完全符合要求了。
废话少说,先贴出代码,看得懂的可以直接拿去用,看不懂的,可以看我后面的具体说明。
已经把它封装成通用脚本了,你可以直接调用。

