给站点做了一个备用的 rss 订阅

2026-04-29 08:452阅读0评论SEO基础
  • 内容介绍
  • 文章标签
  • 相关推荐
问题描述:

最近站点的 RSS 被 cf waf 波及,导致时断时续,即使用了站内老哥的 deno 代理方案也是经常 403。

所以在本地写了一个定时任务,用脚本绕过 cf waf 获取 rss。
服务部署在 cf,给大家试用下。
我本人也在用这个方案,有问题一般会第一时间发现。其他佬有问题也可以反馈。

服务地址: https://linuxdorss.longpink.com/

如果有版权问题可以删掉。

  • 更新频率:10分钟
  • 提供全部 rss 和分类 rss(和站内的分类一样)
  • 没有提供 tag 类的 rss,因为 rss 原始文件没有 tag 标签,所以无法实现;如果通过逐个爬 tag rss 成本太高(tag 太多了)
  • rss 保留 24 小时内的内容(主要是为了避免爬取失败导致遗失部分内容,保留多一点内容可以保证 rss 阅读器下次继续拉取)

服务不一定稳定,建议和站点原始 rss 或者 deno 代理的方案一起订阅。

后续站点 rss 的 waf 问题解决后,可能也会移除这个服务。若移除会提前通知。

网友解答:
--【壹】--:

我隐约记得用 worker 写爬虫过盾会被 cf 发邮件警告来着,当心封号啊


--【贰】--:

ttrss


--【叁】--:

等级贴的初衷就是不被抓吧,用不了也是正常

善解人意屬實有點害羞:

盲猜這個未來會被防出去

这个,不太可能吧,freshrss通过cookie登录的,除非说本地拿不到cookie了。不过这么搞,cookie很容易失效,需要自己去维护,挺麻烦的


--【肆】--:

follow好像用不了呢?


--【伍】--: 善解人意屬實有點害羞:

主要不能爬的是等級貼

freshrss可以通过cookie登录抓取,但是可能会有过不了盾的问题


--【陆】--:

感谢大佬!


--【柒】--:

只要不被墙就好说


--【捌】--:

我是本地爬,只是把 xml 文件部署到 worker 上。这种应该没事。


--【玖】--:

無等級爬那麼快幹嘛


--【拾】--:

有佬知道folo怎么用这个吗


--【拾壹】--:

感谢分享


--【拾贰】--:

这是什么工具 佬


--【拾叁】--:

deno 能爬,就是经常 403,要隔一段时间才能爬成功(可能是切 IP 了)。所以更新不会那么及时。


--【拾肆】--:

image1194×1084 56.3 KB
用上了 oh yeah


--【拾伍】--:

我建议始皇rss域名和主要域名分开
省的规则影响了


--【拾陆】--:

盲猜這個未來會被防出去
畢竟
https://linux.do/c/resource/resource-lv2/84.rss
這類的是直接不能用了


--【拾柒】--:

沒啥意義 deno還是能爬
主要不能爬的是等級貼


--【拾捌】--:

个人喜好吧,交易分类的帖子希望及时一点,再搭配 apprise 进行通知。


--【拾玖】--:

curl_cffi可以过盾,配合代理池,凑合用了

标签:RSS
问题描述:

最近站点的 RSS 被 cf waf 波及,导致时断时续,即使用了站内老哥的 deno 代理方案也是经常 403。

所以在本地写了一个定时任务,用脚本绕过 cf waf 获取 rss。
服务部署在 cf,给大家试用下。
我本人也在用这个方案,有问题一般会第一时间发现。其他佬有问题也可以反馈。

服务地址: https://linuxdorss.longpink.com/

如果有版权问题可以删掉。

  • 更新频率:10分钟
  • 提供全部 rss 和分类 rss(和站内的分类一样)
  • 没有提供 tag 类的 rss,因为 rss 原始文件没有 tag 标签,所以无法实现;如果通过逐个爬 tag rss 成本太高(tag 太多了)
  • rss 保留 24 小时内的内容(主要是为了避免爬取失败导致遗失部分内容,保留多一点内容可以保证 rss 阅读器下次继续拉取)

服务不一定稳定,建议和站点原始 rss 或者 deno 代理的方案一起订阅。

后续站点 rss 的 waf 问题解决后,可能也会移除这个服务。若移除会提前通知。

网友解答:
--【壹】--:

我隐约记得用 worker 写爬虫过盾会被 cf 发邮件警告来着,当心封号啊


--【贰】--:

ttrss


--【叁】--:

等级贴的初衷就是不被抓吧,用不了也是正常

善解人意屬實有點害羞:

盲猜這個未來會被防出去

这个,不太可能吧,freshrss通过cookie登录的,除非说本地拿不到cookie了。不过这么搞,cookie很容易失效,需要自己去维护,挺麻烦的


--【肆】--:

follow好像用不了呢?


--【伍】--: 善解人意屬實有點害羞:

主要不能爬的是等級貼

freshrss可以通过cookie登录抓取,但是可能会有过不了盾的问题


--【陆】--:

感谢大佬!


--【柒】--:

只要不被墙就好说


--【捌】--:

我是本地爬,只是把 xml 文件部署到 worker 上。这种应该没事。


--【玖】--:

無等級爬那麼快幹嘛


--【拾】--:

有佬知道folo怎么用这个吗


--【拾壹】--:

感谢分享


--【拾贰】--:

这是什么工具 佬


--【拾叁】--:

deno 能爬,就是经常 403,要隔一段时间才能爬成功(可能是切 IP 了)。所以更新不会那么及时。


--【拾肆】--:

image1194×1084 56.3 KB
用上了 oh yeah


--【拾伍】--:

我建议始皇rss域名和主要域名分开
省的规则影响了


--【拾陆】--:

盲猜這個未來會被防出去
畢竟
https://linux.do/c/resource/resource-lv2/84.rss
這類的是直接不能用了


--【拾柒】--:

沒啥意義 deno還是能爬
主要不能爬的是等級貼


--【拾捌】--:

个人喜好吧,交易分类的帖子希望及时一点,再搭配 apprise 进行通知。


--【拾玖】--:

curl_cffi可以过盾,配合代理池,凑合用了

标签:RSS