拾盐记 —— 知乎内容的收藏库 佬们,来看一下

2026-04-13 12:071阅读0评论SEO资源
  • 内容介绍
  • 相关推荐
问题描述:

各位佬们,

这两天搞了这个小工具 —— 拾盐记

能干啥?

支持知乎问答和盐选付费专栏链接
自动破解字体反爬(就是那个复制出来是乱码的问题)
本地存储,永久保存
支持搜索(文章前1k字符内检索),找内容超方便
可以导出 Markdown,做笔记无压力
支持深色模式,护眼阅读

怎么用?

  1. 复制知乎链接(注意不能用 App 里的"复制链接",要用浏览器打开后复制地址栏)
  2. 粘贴到搜索框
  3. 点一下,等几秒,搞定

就这么简单。

现有内容大部分是资源导入的。

202512241016032680×1588 383 KB
20251224101652726×1260 106 KB20251224101714744×1256 127 KB

技术栈(给感兴趣的朋友)

  • 框架: Next.js 15 + React 19

  • 样式: Tailwind CSS 4

  • 数据库: PostgreSQL + Prisma ORM

  • 爬虫: cheerio + opentype.js + sharp

  • OCR: DeepSeek-OCR


免责声明:仅供个人学习使用,尊重版权,支持正版~

地址: https://zhihu.artimind.top

有问题欢迎反馈!


网友解答:
--【壹】--:

oh 牛批


--【贰】--:

这个可以搞一搞,感谢分享!书签mark起来


--【叁】--:

佬你好,我想爬取下知乎上的内容,请问您有没有什么项目推荐呢


--【肆】--:

诶woc,这下我可以去看那些规则怪谈了()


--【伍】--:

过年放假的时候处理下账号失活导致服务不可用以及部分文章无法抓取的问题 整体流程都没问题了会再开源出来


--【陆】--:

感谢大佬


--【柒】--:

佬,采集服务貌似出了点问题现在
image1826×638 30.1 KB


--【捌】--:

想看看爬虫


--【玖】--:

从页面中提取自定义的字体,然后画出来,做ocr识别,构建一个unicode到正确文字的映射,重新替换下文章里的错字


--【拾】--:

前排支持佬


--【拾壹】--:

牛 感谢佬的分享 刚好需要~


--【拾贰】--:

感谢佬的分享


--【拾叁】--:

感谢佬,前排支持


--【拾肆】--:

厉害了,佬


--【拾伍】--:

大佬,服务器好像出问题了哎


--【拾陆】--:

佬,牛逼


--【拾柒】--:

付费专栏现在两种方法都只能获取到soia.zhihu.com开头的链接


浪费了40分钟突然想起来,我可以直接在网页端搜标题啊 为什么这么执着在app获取链接


3编

网页端搜不到最近(1个月?)新发的盐选文章,还是得想其他办法


用盐言故事的分享链接


--【拾捌】--:

太喜欢这种有技术含量的帖子了。


--【拾玖】--: Glyn Gareth:

自动破解字体反爬

佬可以讲解一下大概逻辑吗。

问题描述:

各位佬们,

这两天搞了这个小工具 —— 拾盐记

能干啥?

支持知乎问答和盐选付费专栏链接
自动破解字体反爬(就是那个复制出来是乱码的问题)
本地存储,永久保存
支持搜索(文章前1k字符内检索),找内容超方便
可以导出 Markdown,做笔记无压力
支持深色模式,护眼阅读

怎么用?

  1. 复制知乎链接(注意不能用 App 里的"复制链接",要用浏览器打开后复制地址栏)
  2. 粘贴到搜索框
  3. 点一下,等几秒,搞定

就这么简单。

现有内容大部分是资源导入的。

202512241016032680×1588 383 KB
20251224101652726×1260 106 KB20251224101714744×1256 127 KB

技术栈(给感兴趣的朋友)

  • 框架: Next.js 15 + React 19

  • 样式: Tailwind CSS 4

  • 数据库: PostgreSQL + Prisma ORM

  • 爬虫: cheerio + opentype.js + sharp

  • OCR: DeepSeek-OCR


免责声明:仅供个人学习使用,尊重版权,支持正版~

地址: https://zhihu.artimind.top

有问题欢迎反馈!


网友解答:
--【壹】--:

oh 牛批


--【贰】--:

这个可以搞一搞,感谢分享!书签mark起来


--【叁】--:

佬你好,我想爬取下知乎上的内容,请问您有没有什么项目推荐呢


--【肆】--:

诶woc,这下我可以去看那些规则怪谈了()


--【伍】--:

过年放假的时候处理下账号失活导致服务不可用以及部分文章无法抓取的问题 整体流程都没问题了会再开源出来


--【陆】--:

感谢大佬


--【柒】--:

佬,采集服务貌似出了点问题现在
image1826×638 30.1 KB


--【捌】--:

想看看爬虫


--【玖】--:

从页面中提取自定义的字体,然后画出来,做ocr识别,构建一个unicode到正确文字的映射,重新替换下文章里的错字


--【拾】--:

前排支持佬


--【拾壹】--:

牛 感谢佬的分享 刚好需要~


--【拾贰】--:

感谢佬的分享


--【拾叁】--:

感谢佬,前排支持


--【拾肆】--:

厉害了,佬


--【拾伍】--:

大佬,服务器好像出问题了哎


--【拾陆】--:

佬,牛逼


--【拾柒】--:

付费专栏现在两种方法都只能获取到soia.zhihu.com开头的链接


浪费了40分钟突然想起来,我可以直接在网页端搜标题啊 为什么这么执着在app获取链接


3编

网页端搜不到最近(1个月?)新发的盐选文章,还是得想其他办法


用盐言故事的分享链接


--【拾捌】--:

太喜欢这种有技术含量的帖子了。


--【拾玖】--: Glyn Gareth:

自动破解字体反爬

佬可以讲解一下大概逻辑吗。