Hermes 自动化内容生产线

2026年6月10日

tech

Hermes 自动化内容生产线

用 Hermes Agent 搭建的全自动内容生产系统，每天推送13篇内容，效率从5小时降至5分钟。

核心架构：5个专职 Agent

系统模拟报社流水线，由5个专职Agent构成：

Agent	职责	关键技术
Scout	选题	扫描138个信息源，评分公式筛选
Writer	写稿	7道工序，100+正则去AI味
Publisher	发布	Playwright 浏览器自动化
Feedback	数据	回收阅读数据，反哺选题
Orchestrator	调度	文件系统当队列，JSON当协议

通信机制

核心设计：文件系统作为队列，JSON文件作为协议

queue/
├── pending/          # 待发布内容
│   ├── 07:00/        # 按时间槽划分
│   │   ├── article.md
│   │   └── article.meta.json  # 元数据
│   ├── 12:00/
│   ├── 18:00/
│   └── 21:00/
├── published/        # 发布成功
└── failed/           # 发布失败

优势：简单直接，文件流转即数据流。项目扩大后可按需引入数据库。

Scout：智能选题

信息源覆盖

Twitter KOL：48个（如 @karpathy）
RSS订阅：49个（Hacker News, TechCrunch等）
GitHub Trending：28个仓库
Reddit：13个板块
Web搜索：补充

评分公式

总分 = (源质量 ^ 1.3) × 0.22 + 传播潜力 × 0.25 + (新鲜度 × 100) × 0.20

评分维度：

源质量：大V账号权重（35）远高于普通RSS源（15），指数1.3放大差距
新鲜度：爆发期（<6小时）加分，已过期（>48小时）扣分
爆款词库：系统自动学习，命中关键词（AI、大模型、agent）加分

Writer：7道质量工序

致力于消除AI味，每篇文章必须”考试及格”：

抓原文：从URL抓取原始报道，有本地缓存
LLM生成初稿：使用GLM API
AI腔审校（关键步骤）：
- 100多条正则规则，分6大类检测
- 套话连篇（9条）、AI句式（4条）、书面词汇（10条）
- 结构机械、态度中立（3条）、细节缺失（6条）
- 按严重程度扣分（满分100），AI初稿通常30-50分，审校后可达90+分
批评-修订循环：另一个LLM当”评委”打分，低于70分打回重写，最多改2轮
排版：中英文加空格、段落加空行、自动加hashtag
标题优化（仅限长文）：生成3个候选标题，选分数最高的
配图：大模型生图API（美观）或HTML模板渲染信息图（免费）

质量数据示例

{
  "proofread_score": 93,
  "critique_scores": [65, 92],
  "revised": true,
  "title_score": 60,
  "word_count": 564
}

Publisher：模拟真人发布

挑战：头条无发布API，必须实现浏览器自动化

技术方案：

使用 Playwright CLI 控制Chromium浏览器
服务器无显示器：安装 Xvfb 虚拟显示器
草稿箱容量：设置自动清理逻辑，超过100篇自动删旧
Cookie过期：需手动更新本地Cookie文件

安全策略：所有内容只进草稿箱，绝不直接发布。发布后通知Discord和微信进行人工确认。

Feedback：数据驱动的优化飞轮

数据回收：自动登录头条后台抓取阅读、评论、分享数据

爆款词库：更新 hit_library.json，记录表现好的关键词和标题模式

反哺系统：

Scout选题时，命中词库的选题获得额外加分
Feedback将趋势分析写入 program.md，例如”对比型标题最近表现好”

核心：系统从数据中自主学习什么内容方向更受读者欢迎，形成”选题→写作→发布→数据→优化选题”的飞轮。

Dashboard：系统监控仪表盘

技术实现：

后端：Python标准库 HTTPServer（1125行代码）
前端：一个HTML文件用 Tailwind + Chart.js（742行）

5个Tab页面：

System Health：展示所有cron任务的时间线和状态
Pipeline：显示每个时间槽内容的状态和质量分数
Quality：展示质量分数趋势、内容方向分布
Performance：展示阅读量等性能数据趋势
Scout：展示候选选题的分数和来源分布

如何复现

最小可用版仅需3个脚本约500行代码：

1. 安装Hermes Agent

hermes setup  # 交互式配置

2. 编写核心脚本

# 模式统一：1. 读输入 2. 调LLM 3. 写输出
input_data = read_json("queue/pending/scout_results.json")
result = llm_call(prompt, input_data)
write_json(f"queue/pending/{slot}/xxx.meta.json", result)

3. 用文件命名约定串联脚本

scout_results.json → YYYYMMDD-HHMMSS-article.md + .meta.json → 移至 published/

4. 配置cron定时任务

# crontab -e
30 5  * * * /path/cron-pipeline.sh prepare 07:00 1 2   # 早高峰
30 10 * * * /path/cron-pipeline.sh prepare 12:00 1 2   # 午休
0  16 * * * /path/cron-pipeline.sh prepare 18:00 2 3   # 晚高峰
30 19 * * * /path/cron-pipeline.sh prepare 21:00 0 2   # 睡前

核心启示

不要从头造轮子：善用现有工具和框架快速搭建
文件即队列：简单直接，避免过度工程化
人在回路中：自动化流程，人工最终确认
数据驱动：从数据中学习，持续优化

效果

一个人配合几个AI Agent，可以有效顶替一个小型内容团队，实现高效、高质量的内容自动化生产。

参考来源：自动化内容生产线总结：使用Hermes与5个Agent每日高效发布

标签：#Hermes #自动化 #内容生产 #AI Agent #效率工具