0
点赞
收藏
分享

微信扫一扫

使用Feed43为网页生成RSS订阅源

前端王祖蓝 2022-04-15 阅读 74
大数据

简介

在我们使用Rss时候发现很多的网站并不支持Rss服务,如果自己使用Rsshub,Huginn等搭建订阅源,不单单需要懂一些编程和服务器部署的知识,还需要买服务器。如果只是轻度的使用那么完全可以试试FEED43,通过FEED43提供的免费服务可以为静态网页生成订阅源。

步骤总览

  1. 准备好需要解析的网站网址(必须是服务端渲染页面网站,也就是常说的静态网页)。
  2. 注册好Feed43的账号,并登录。
  3. 使用Feed43解析网页源码。
  4. 分析网页源码,找到哪一动态部分内容是自己需要的。
  5. 根据分析出来的自己需要获取的动态内容编写提取规则。
  6. 根据提取出来的内容调整优化提取规则。
  7. 将提取出来的内容匹配到信息流。
  8. 生成Rss订阅源,完成订阅。

准备好网址

这里我们用电脑爱好者这个网站,我们需要爬取这一个列表里面的内容。

注册账号

  1. Feed43官网注册好账号。
  2. 打开Feed43官方网站,点击Create your first RSS feed。

使用Feed43解析出网页源码

image.png

填入网址进行解析:

点击 Reload,你就会在下面的选框中看到当前网页的源代码了。

分析网页源码

Feed43 它会自动捕捉一些标记标题的源码,并标识成粉红色,当然也不是很准确,需要自己酌情修改。通过比对源码我们发现,有如下代码是一致的,只是内容不同,也就是我们需要的列表里面的内容:

<a href="https://www.cfan.com.cn/2022/0411/136391.shtml" target="_blank" title="系统小技巧:按需显示 文件夹查看方式我做主">
<div class="left-post-pic" style="background:url(https://upload.cfan.com.cn/2022/0411/1649641391945.png)no-repeat center;background-size:cover;"></div>
<div class="left-post-info" style="position:relative;">
<h1 class="left-post-title">系统小技巧:按需显示 文件夹查看方式我做主</h1>
<div class="left-post-txt">为了便于查看和整理文件,我们经常会对文件夹的查看方式进行专门的设置,比如查看图片文件夹习惯于使用缩略图的方式,查看文档则喜欢使用列表形式,而对于文档、图片混合的...</div>
</a>

定义提取规则

定义提取规则。将标题、链接等变化的字段删去用{%}代替。将固定且多余的字段删去用{*}代替。源码中有换行的地方均需要添加{*}

<a href={%} {*} title={%}>{*}
<div class="left-post-pic" style="background:url({%})no-repeat center;background-size:cover;"></div>{*}
<div class="left-post-info" style="position:relative;">{*}
<h1 class="left-post-title">{%}</h1>{*}
<div class="left-post-txt">{%}</div>{*}
</a>{*}

检查匹配规则

将上一步我们定义好的规则进行填入:

显示绿色的OK (N items found),则代表成功了。看一看抓取到的内容是否有格式错误的地方。如果没有抓取到内容,或者有格式错误,则需要继续仔细分析然后进行调整。

匹配信息流数据

这一步需要将定义提取规则获取到的动态内容和我们Rss信息流匹配起来,Item Title Template(标题)、Item Link Template(链接)、Item Content Template(全文内容),将第二步获取到的内容输入,{%数字}的形式

生成Rss订阅源


当然,你也可以随时修改或者删除此RSS订阅源。

总结

使用 Feed43 最大的好处就是,不需要自己搭建服务器就可以将那些不支持 RSS 的页面变成 RSS 方便订阅。Feed43的缺点,免费版只会每6小时抓取一次,每次只提取20条消息。

举报

相关推荐

0 条评论