Calibre 使用教程之抓取 RSS 制成电子书

之前 Kindle 伴侣曾经写过一篇文章——在 Google Developer Console 上用 KindleEar 搭建 RSS 推送服务器,架设成功后可以添加你所喜欢的 RSS 订阅源,KindleEar 就可以自动抓取最新文章,并以期刊的形式定时推送到你的 Kindle 中。那除此之外,有没有其他抓取 RSS 订阅源的方法?当然有!Calibre 自身就带有 RSS 抓取功能模块,KindleEar 便是采用的该模块为基础写成的。虽然 Calibre 带有命令行的操作方式,但对于普通用户来讲不怎么友好,所以本文仅以界面操作方式为例作说明。

一、准备订阅源

RSS 订阅地址五花八门没有一定的规律,所以获取 RSS 地址的方法也不尽相同。一般提供 RSS 订阅的站点都会提供一个 RSS 图标,点开就可以得到该站点的 RSS 订阅地址。如果页面上没有此图标,可以查看一下网页的源代码,找到 <link rel="alternate" type="application/rss+xml" title="<title>" href="<url>" /> 这样的行,其中的 <url> 就是 RSS 地址。另外还有一些浏览器如 Firefox、Opera 会自动获取网站的 RSS 订阅地址,并在地址栏上标示小 RSS 图标,也能方便地获取该站点的 RSS 地址。

二、添加订阅源

准备好 RSS 订阅源后,就可以在 Calibre 中添加这些订阅源了。打开 Calibre,在 Calibre 主界面上方的功能图标中找到“抓取新闻”,点击右侧的向下箭头,在弹出的菜单中点“添加自定义新闻源”。

calibre-rss_1

在弹出的对话框中,点击【New recipe】按钮,切换到“添加自定义新闻来源”对话框。在“订阅清单标题”中输入一个名字,比如“我的订阅”(这个名字是一个分类名,其下将会包含一组 RSS 订阅地址)。

最老文章”可以设置抓取文章的时效性,默认情况下,Calibre 只会抓取最近 7 天的文章,如果想要抓取更多,可以自定更改天数。“每个源的最多文章数”可以设置抓取文章的数量上限。不过需要注意的是,这两项设置都受限于网站 RSS 的输出方式,比如有些网站的 RSS 只输出数量有限的最新几篇文章,所以不管在 Calibre 中怎么设置,都受此限制,不一定能获取到指定数量的文章;

接下来,需要在“将新闻加入订阅”中添加我们准保好的 RSS 地址。在“源名称”中也输入 RSS 订阅的名字,比如“Kindle伴侣”;然后再“源网址”中输入 RSS 地址,如“https://kindlefere.com/feed”;最后点击【添加源】按钮,就可以把一条 RSS 订阅添加到“订阅清单中的新闻”中了。在一个订阅清单中可以抓取多个 RSS 源,所以可以重复操作输入多个 RSS 源名称和源网址并多次添加。

calibre-rss_2

添加完成 RSS 订阅地址后。点击右下角的【保存】按钮保存,返回到“添加自定义新闻源”界面。如果需要修改,可以在左侧列表选中一个项目,然后点击【Edit this recipe】按钮修改。如果想要修改,则点击【Remove this recipe】按钮删除。没什么问题的话可以点击【关闭】按钮返回 Calibre 主界面。

三、抓取并推送

设置好订阅源后就可以抓取新闻了。同样,在 Calibre 主界面上方的功能图标中找到“抓取新闻”,点击它,会弹出一个“定期新闻下载”的对话框。在左侧列表中找到“自定义”分类,点击展开,就可以找到你刚刚添加的订阅清单,选中后点界面下方的【立即下载】按钮,Calibre 便会开始抓取 RSS 内容。

calibre-rss_3

抓取成功后,Calibre 会生成一本期刊格式的电子书并自动存放到书库中。如果你设置了邮件推送,Calibre 还会把生成好的电子书自动推送到云端,以便自动同步到你的 Kindle 中。

calibre-rss_4

当然,除了这种手动抓取的方式外,还可以通过“计划下载”定时抓取,比如按每周、每月或每隔指定天数抓取 RSS 内容,不过前提是你得一直开着电脑并保持电脑的联网状态。

另外还需要注意,有些网站的 RSS 仅输出摘要,这样 Calibre 也只能抓取到摘要内容;还有就是如果你订阅的 RSS 被墙了,并且你的网络没有使用代理的话,将无法成功抓取。

有帮助,[ 捐助本站 ] 或分享给小伙伴:

发表评论

标注为 * 的是必填项。您填写的邮箱地址将会被保密。如果是在本站首次留言,审核后才能显示。
若提问,请务必描述清楚该问题的前因后果,提供尽可能多的对分析该问题有帮助的线索。

小伙伴们发表了 14 条评论

  1. 想请问一下为什么用calibre抓取新闻之后在kindle上只显示标题和日期,内容都是空白呢?

    • Lily 您好。确认源是没有错误的,不过此网址在大陆是被屏蔽的,如果是在本机抓取请使翻墙。

  2. 【抓取成功后,Calibre 会生成一本期刊格式的电子书并自动存放到书库中。如果你设置了邮件推送,Calibre 还会把生成好的电子书自动推送到云端,以便自动同步到你的 Kindle 中。】
    这里生成的电子书是epub格式的,推送到云端会收到
    【尊敬的客户,

    您从2016年3月12日6:14 发出的如下文档无法发送到您指定的Kindle上:
    * Wo De Ding Yue [Zhou Liu , 12 3Yue 2016] – calibre.epub

    Kindle个人文档服务目前只能转换并发送以下类型的文档:
    Microsoft Word (.doc, .docx)
    RTF文件(.rtf)
    HTML(.htm, .html)
    TXT文件(.txt)
    Zip, x-zip压缩文件
    Mobi格式电子书

    JPEG (.jpg), GIF (.gif), Bitmap (.bmp) 和 PNG (.png) 格式的图片。
    Adobe PDF (.pdf)文档可维持原文件格式,发送至您的Kindle。

    Adobe PDF (.pdf)文档可转换为Kindle格式发送,目前处于试用阶段。

    如上述格式的文档未成功发送,请确认文档是否受到密码保护或被加密。特别说明,目前最新的Kindle支持读取受密码保护的PDF文档。

    要怎么自动生成mobi 格式文件

    • 奔跑 你好。请进入 Calibre 的设置,在“操作方式”中,将“首选输出格式”设置为“MOBI”。