如何用Python解析Markdown文档中的图片并保存在本地?
- 内容介绍
- 相关推荐
本文共计739个文字,预计阅读时间需要3分钟。
背景+前言简述:书籍犹如良药,让我心情舒畅,大部分博客都发布在简书上。固然简书提供了打包导出功能,但仅能导出文字,图片的文字描述仍需在简书服务器上查看。
背景前阵子简书好像说是凉了,搞得我有点小慌,毕竟我的大部分博客都是放在简书上面的,虽然简书提供了打包导出功能,但是只能导出文字,图片的话还是存在简书服务器上面,再加上我一直想要重新做一个个人博客,于是就有了这篇文章。
思路首先是要解析markdown文档,然后获取到其中的所有图片,再把图片按md文件分好目录保存。
解析markdown文档这里我用了misaka模块,据说是python的markdown解析器里性能最好的,不过这个的文档着实是精简,太少内容了,写得不清不楚的,基本功能看来就是把markdown文档解析为html文档,但是好像没有直接操作markdown元素的方法。
没事,我可以像平时写爬虫那样解析html呀,不就曲线救国拿到图片了吗~
这里就用BeautifulSoup啦
很简单,就是requests,没啥好说的。
本文共计739个文字,预计阅读时间需要3分钟。
背景+前言简述:书籍犹如良药,让我心情舒畅,大部分博客都发布在简书上。固然简书提供了打包导出功能,但仅能导出文字,图片的文字描述仍需在简书服务器上查看。
背景前阵子简书好像说是凉了,搞得我有点小慌,毕竟我的大部分博客都是放在简书上面的,虽然简书提供了打包导出功能,但是只能导出文字,图片的话还是存在简书服务器上面,再加上我一直想要重新做一个个人博客,于是就有了这篇文章。
思路首先是要解析markdown文档,然后获取到其中的所有图片,再把图片按md文件分好目录保存。
解析markdown文档这里我用了misaka模块,据说是python的markdown解析器里性能最好的,不过这个的文档着实是精简,太少内容了,写得不清不楚的,基本功能看来就是把markdown文档解析为html文档,但是好像没有直接操作markdown元素的方法。
没事,我可以像平时写爬虫那样解析html呀,不就曲线救国拿到图片了吗~
这里就用BeautifulSoup啦
很简单,就是requests,没啥好说的。

