约 1.6k 字    6 分钟阅读

适用场景 #

  • 用户要求生成 RSS 日报、每日资讯、今日新闻
  • 用户要求从 RSS 源抓取并筛选重要新闻
  • 用户要求生成信息简报

RSS 源清单 #

完整源清单参见文章:RSS 源大全

实际使用的源(已验证可访问) #

领域源名称RSS 地址
AI 官方OpenAI Bloghttps://openai.com/blog/rss.xml
AI 官方Google DeepMindhttps://deepmind.google/blog/rss.xml
AI 官方Google AI Bloghttps://blog.google/technology/ai/rss/
学术arXiv AIhttps://rss.arxiv.org/rss/cs.AI
学术arXiv MLhttps://rss.arxiv.org/rss/cs.LG
学术arXiv NLPhttps://rss.arxiv.org/rss/cs.CL
学术arXiv CVhttps://rss.arxiv.org/rss/cs.CV
顶刊Naturehttps://www.nature.com/nature/articles.rss
科普ScienceDailyhttps://www.sciencedaily.com/rss/all.xml
科普New Scientisthttps://www.newscientist.com/section/news/feed/
技术Hacker Newshttps://hnrss.org/frontpage
技术Hacker News AIhttps://hnrss.org/newest?q=AI
技术GitHub Bloghttps://github.blog/feed/
技术Ars Technicahttps://feeds.arstechnica.com/arstechnica/index
科技商业TechCrunchhttps://techcrunch.com/feed/
开发者Stack Overflow Bloghttps://stackoverflow.blog/feed/
开发者Dev.tohttps://dev.to/feed/
编程语言Rust Bloghttps://blog.rust-lang.org/feed.xml
编程语言Go Bloghttps://go.dev/blog/feed.atom
编程语言Python Bloghttps://blog.python.org/feeds/posts/default
编程语言TypeScript Bloghttps://devblogs.microsoft.com/typescript/feed/
编程语言Kotlin Bloghttps://blog.jetbrains.com/kotlin/feed/
中文博客阮一峰https://www.ruanyifeng.com/blog/atom.xml
中文博客OneV’s Denhttps://onevcat.com/atom.xml
新闻NPR Newshttps://feeds.npr.org/1001/rss.xml
新闻NHK Worldhttps://www3.nhk.or.jp/rss/news/cat0.xml
安全BleepingComputerhttps://www.bleepingcomputer.com/feed/

抓取策略 #

批量抓取 #

  1. 将所有源分为 5-6 批,每批 5-6 个源
  2. 使用 webfetch 工具并行抓取每批
  3. 超时设置 15 秒
  4. 失败的源跳过,不阻塞其他源

抓取流程 #

1
2
3
4
5
第1批:学术源(arXiv x4 + Nature + ScienceDaily)
第2批:AI 官方 + 科普(OpenAI + DeepMind + Google AI + New Scientist)
第3批:技术媒体(HN + GitHub + Ars Technica + TechCrunch + Stack Overflow)
第4批:编程语言(Rust + Go + Python + TypeScript + Kotlin)
第5批:中文 + 新闻 + 安全(阮一峰 + OneV's Den + NPR + NHK + BleepingComputer)

筛选标准 #

筛选维度(按权重排序) #

  1. 重要程度(50%):是否为突破性进展、重大事件、影响广泛
  2. 领域多样性(30%):确保覆盖 AI、科学、安全、商业、新闻等多个领域
  3. 时效性(20%):优先选择 24-48 小时内的新闻

筛选数量 #

  • 固定选 20 条
  • 按领域分组,不按死板的编号列表

排序规则 #

按重要程度分组排列,组内按时间排序。

文章格式 #

文件命名 #

1
rss-daily-YYYY-MM-DD.md

Front-Matter #

1
2
3
4
5
6
7
8
9
10
11
---
title: "RSS 日报 · YYYY-MM-DD"
date: YYYY-MM-DD 08:00:00
categories:
- [技术, 信息获取]
tags:
- RSS
- 日报
- 信息获取
description: "YYYY年M月D日 RSS 日报,从 N 个可信源中精选 20 条重要资讯,涵盖 AI、科学、安全、商业、国际新闻等领域,按重要程度排列。"
---

正文结构(关键:美观 + 分析师解读) #

核心原则:不是干巴巴的新闻列表,而是有温度、有洞察的信息简报。每条新闻都要有分析师视角的解读,帮助读者理解”为什么这很重要”。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
> **今日导语**:一段 2-3 句的开篇语,概括今日信息主旋律,像专业分析师的晨会开场。
>
> 📡 数据源:N 个 | 📊 筛选:20 条 | 🕐 截止时间
>
> 完整源清单:[RSS 源大全](/2026/06/17/rss-source-collection/)

---

## 🤖 AI 前沿

### 标题(用 emoji 或自然标题,不用编号)

> **来源**:xxx · **时间**:xxx

新闻摘要(2-3 句概括事实,客观陈述)。

**分析师解读**:这段是关键。用 1-2 句话解释为什么这条新闻重要、对行业意味着什么、读者应该关注什么。要有观点,不是复述新闻。可以用比喻、对比、历史参照等方式增强可读性。

🔗 [阅读原文](url)

---

### 下一条标题
...(同上格式)

---

## 🔬 科学突破

### 标题
...(同上格式)

---

## 🔒 安全警报

### 标题
...

---

## 💼 商业与资本

### 标题
...

---

## 🌍 国际视野

### 标题
...

---

## 📱 产品与生态

### 标题
...

---

## 📊 今日全景

| 领域 | 条数 | 亮点 |
|------|------|------|
| AI 前沿 | N | 一句话亮点 |
| 科学突破 | N | ... |
| 安全警报 | N | ... |
| ... | ... | ... |

> **明日关注**:1-2 句提示明天值得跟踪的事件或趋势。

排版要点 #

  1. 分组而非编号:用 ## 🤖 AI 前沿## 🔬 科学突破 等 emoji 标题分组,不用 ## 1.## 2. 死板编号
  2. 每条新闻三段式:摘要(事实)→ 分析师解读(洞察)→ 链接
  3. 分析师解读必须有观点:不是”这很重要”,而是”这意味着 X 格局可能改变,因为 Y”
  4. 开篇有导语:像晨报一样概括今日主旋律
  5. 结尾有全景表 + 明日关注:帮助读者快速回顾和前瞻
  6. 适当使用加粗、引用块:增强视觉层次
  7. emoji 适度:分组标题用 emoji,正文不用

分析师解读写作指南 #

好的解读示例:

分析师解读:SpaceX 短暂超越亚马逊不是噱头——它标志着”太空基建”正在被资本市场重新定价为”科技平台”而非”航天承包商”。当一家公司的估值逻辑从”发射次数”转向”星际基础设施”,估值天花板就消失了。

差的解读示例(禁止):

分析师解读:这条新闻非常重要,值得大家关注。

解读的角度可以是:

  • 行业格局变化(谁赢谁输)
  • 技术趋势信号(风向标意义)
  • 资本市场逻辑(估值/投资含义)
  • 社会影响(伦理/政策含义)
  • 历史对比(类似事件参照)

部署 #

生成文章后执行标准部署流程:

1
npx hexo clean; if ($?) { npx hexo g }; if ($?) { ... deploy }

注意事项 #

  • 抓取量很大(arXiv 单源可返回 500KB+),webfetch 会被截断,需关注截断内容
  • 部分源可能临时不可访问(网络/代理),跳过即可
  • 日报日期为生成日期的第二天(如 6 月 17 日晚上抓取,生成 6 月 18 日日报)
  • 不要包含重复新闻(多个源报道同一事件时只保留一条,选择可信度最高的源)
  • 加密文章不参与日报
  • 每条新闻必须有分析师解读,不能只列事实
  • 分组标题用 emoji,正文不用编号