Huginn
利用Huginn自制个性化RSS源的零基础教程其一:利用电视盒子H96 Max安装 Armbian搭建个人linux服务器及Huginn安装
背景部分: 我希望借助RSS打破大数据推送带来的信息壁垒。大数据太了解我了,面对各种APP的搔首弄姿,我每天需要花费大量精力来控制自己的“好奇心”。我曾尝试通过主动订阅来改善现状,但很快发现了新的问题:推送内容重复、质量良莠不齐、无用信息占比高等等。因此,我拔下奶嘴,走出茧房,拿出RSS,开始新一轮的战斗,去捍卫我精神领土的那一丝自由。 [图片] 我希望借助huginn实现RSS信息的个人定制与简单筛选。因为种种原因,RSS已…
使用Huginn自动化抓取大学学院通知
前言Huginn对于js的动态页面抓取,需要借助一些第三方的工具,我们的helloworld不考虑那种难度的页面,我们考虑一些静态页面,比如一些学院的官网通知之类的,这里就以清华大学计算机学院的通知为例进行抓取展示,其他类型的通知抓取方法类似。通知公告-清华大学计算机科学与技术系 总体流程图新建一个任务组Scenario,然后在Scenario下面再新建两个对应的Agent(一个获取信息,一个输出RSS信息)即可 [图片] 新建一个任务组Scenario [图片] 输…
前言Huginn对于js的动态页面抓取,需要借助一些第三方的工具,我们的helloworld不考虑那种难度的页面,我们考虑一些静态页面,比如一些学院的官网通知之类的,这里就以清华大学计算机学院的通知为例进行抓取展示,其他类型的通知抓取方法类似。通知公告-清华大学计算机科学与技术系 总体流程图新建一个任务组Scenario,然后在Scenario下面再新建两个对应的Agent(一个获取信息,一个输出RSS信息)即可 [图片] 新建一个任务组Scenario [图片] 输…
RSS 完结篇:节省千元服务费,RSSHub、Huginn 转移 NAS
作为重度RSS用户,90%的讯息来自rss。RSSHub 生成主流媒体rss,Huginn 定制个性化rss,TinyTinyRSS 过滤rss,这帮我 从3小时的阅读时间节省到只需1小时。这些服务原本托管在1核1G的低配服务器上,不过配置过低,频繁重启,维护成本持续上升。接着尝试了国外2核4G的低端服务器,超售严重,性能极度不稳定。买国外的低端服务器(特别是 俄罗斯服务器),就是把钱丢水里了。 比起花钱升级和不靠谱的国外VPS,NAS 成为一个高性价比的选…
群晖Huginn获取豆瓣书评全文
总体步骤分三步,Agent Event Flow如下: [图片] 获取热门书评页面(https://book.douban.com/review/best/ )的各个书评链接 1)创建website agent,基本配置如下: [图片] 2) option 配置 只用获取各个书评的URL即可,xpath获取的方式【 利用 Huginn 打造一站式信息阅读平台 】中说的比较清楚,借助XPath Helper 确认。{ "expected_update_period_in_days": "2", "url": "https://book.douban.com/review/best/", "type": "html", "mode": "on_change", "extra…
群晖安装Huginn后的配置与调试
如下文章讲获取某个网站的Huginn配置非常详细了, 利用 Huginn 打造一站式信息阅读平台 有几点补充: 创建完第二个website agents(即获取全文的website agents)后,点击dry run进行测试时,要点一下received events 中的任意一项,再点击Dry run,进行测试。 [图片] 2. 调试前需要清空agents。有的时候不是一次性配置成功,需要多次调试。可能遇到的问题: 1)Dry Run测试结果OK,实际输出跟Dry Run输出不一致 2)修改后查看某个agents…