如何用Python解析Markdown文档中的图片并保存在本地?

2026-05-17 00:140阅读0评论SEO问题
  • 内容介绍
  • 相关推荐

本文共计739个文字,预计阅读时间需要3分钟。

如何用Python解析Markdown文档中的图片并保存在本地?

背景+前言简述:书籍犹如良药,让我心情舒畅,大部分博客都发布在简书上。固然简书提供了打包导出功能,但仅能导出文字,图片的文字描述仍需在简书服务器上查看。

背景

前阵子简书好像说是凉了,搞得我有点小慌,毕竟我的大部分博客都是放在简书上面的,虽然简书提供了打包导出功能,但是只能导出文字,图片的话还是存在简书服务器上面,再加上我一直想要重新做一个个人博客,于是就有了这篇文章。

思路

首先是要解析markdown文档,然后获取到其中的所有图片,再把图片按md文件分好目录保存。

解析markdown文档

这里我用了misaka模块,据说是python的markdown解析器里性能最好的,不过这个的文档着实是精简,太少内容了,写得不清不楚的,基本功能看来就是把markdown文档解析为html文档,但是好像没有直接操作markdown元素的方法。

如何用Python解析Markdown文档中的图片并保存在本地?

没事,我可以像平时写爬虫那样解析html呀,不就曲线救国拿到图片了吗~
这里就用BeautifulSoup啦

下载图片

很简单,就是requests,没啥好说的。

阅读全文

本文共计739个文字,预计阅读时间需要3分钟。

如何用Python解析Markdown文档中的图片并保存在本地?

背景+前言简述:书籍犹如良药,让我心情舒畅,大部分博客都发布在简书上。固然简书提供了打包导出功能,但仅能导出文字,图片的文字描述仍需在简书服务器上查看。

背景

前阵子简书好像说是凉了,搞得我有点小慌,毕竟我的大部分博客都是放在简书上面的,虽然简书提供了打包导出功能,但是只能导出文字,图片的话还是存在简书服务器上面,再加上我一直想要重新做一个个人博客,于是就有了这篇文章。

思路

首先是要解析markdown文档,然后获取到其中的所有图片,再把图片按md文件分好目录保存。

解析markdown文档

这里我用了misaka模块,据说是python的markdown解析器里性能最好的,不过这个的文档着实是精简,太少内容了,写得不清不楚的,基本功能看来就是把markdown文档解析为html文档,但是好像没有直接操作markdown元素的方法。

如何用Python解析Markdown文档中的图片并保存在本地?

没事,我可以像平时写爬虫那样解析html呀,不就曲线救国拿到图片了吗~
这里就用BeautifulSoup啦

下载图片

很简单,就是requests,没啥好说的。

阅读全文