Hermes 自动化内容生产线
Hermes 自动化内容生产线
用 Hermes Agent 搭建的全自动内容生产系统,每天推送13篇内容,效率从5小时降至5分钟。
核心架构:5个专职 Agent
系统模拟报社流水线,由5个专职Agent构成:
| Agent | 职责 | 关键技术 |
|---|---|---|
| Scout | 选题 | 扫描138个信息源,评分公式筛选 |
| Writer | 写稿 | 7道工序,100+正则去AI味 |
| Publisher | 发布 | Playwright 浏览器自动化 |
| Feedback | 数据 | 回收阅读数据,反哺选题 |
| Orchestrator | 调度 | 文件系统当队列,JSON当协议 |
通信机制
核心设计:文件系统作为队列,JSON文件作为协议
queue/
├── pending/ # 待发布内容
│ ├── 07:00/ # 按时间槽划分
│ │ ├── article.md
│ │ └── article.meta.json # 元数据
│ ├── 12:00/
│ ├── 18:00/
│ └── 21:00/
├── published/ # 发布成功
└── failed/ # 发布失败
优势:简单直接,文件流转即数据流。项目扩大后可按需引入数据库。
Scout:智能选题
信息源覆盖
- Twitter KOL:48个(如 @karpathy)
- RSS订阅:49个(Hacker News, TechCrunch等)
- GitHub Trending:28个仓库
- Reddit:13个板块
- Web搜索:补充
评分公式
总分 = (源质量 ^ 1.3) × 0.22 + 传播潜力 × 0.25 + (新鲜度 × 100) × 0.20
评分维度:
- 源质量:大V账号权重(35)远高于普通RSS源(15),指数1.3放大差距
- 新鲜度:爆发期(<6小时)加分,已过期(>48小时)扣分
- 爆款词库:系统自动学习,命中关键词(AI、大模型、agent)加分
Writer:7道质量工序
致力于消除AI味,每篇文章必须”考试及格”:
- 抓原文:从URL抓取原始报道,有本地缓存
- LLM生成初稿:使用GLM API
- AI腔审校(关键步骤):
- 100多条正则规则,分6大类检测
- 套话连篇(9条)、AI句式(4条)、书面词汇(10条)
- 结构机械、态度中立(3条)、细节缺失(6条)
- 按严重程度扣分(满分100),AI初稿通常30-50分,审校后可达90+分
- 批评-修订循环:另一个LLM当”评委”打分,低于70分打回重写,最多改2轮
- 排版:中英文加空格、段落加空行、自动加hashtag
- 标题优化(仅限长文):生成3个候选标题,选分数最高的
- 配图:大模型生图API(美观)或HTML模板渲染信息图(免费)
质量数据示例
{
"proofread_score": 93,
"critique_scores": [65, 92],
"revised": true,
"title_score": 60,
"word_count": 564
}
Publisher:模拟真人发布
挑战:头条无发布API,必须实现浏览器自动化
技术方案:
- 使用 Playwright CLI 控制Chromium浏览器
- 服务器无显示器:安装
Xvfb虚拟显示器 - 草稿箱容量:设置自动清理逻辑,超过100篇自动删旧
- Cookie过期:需手动更新本地Cookie文件
安全策略:所有内容只进草稿箱,绝不直接发布。发布后通知Discord和微信进行人工确认。
Feedback:数据驱动的优化飞轮
数据回收:自动登录头条后台抓取阅读、评论、分享数据
爆款词库:更新 hit_library.json,记录表现好的关键词和标题模式
反哺系统:
- Scout选题时,命中词库的选题获得额外加分
- Feedback将趋势分析写入
program.md,例如”对比型标题最近表现好”
核心:系统从数据中自主学习什么内容方向更受读者欢迎,形成”选题→写作→发布→数据→优化选题”的飞轮。
Dashboard:系统监控仪表盘
技术实现:
- 后端:Python标准库
HTTPServer(1125行代码) - 前端:一个HTML文件用 Tailwind + Chart.js(742行)
5个Tab页面:
- System Health:展示所有cron任务的时间线和状态
- Pipeline:显示每个时间槽内容的状态和质量分数
- Quality:展示质量分数趋势、内容方向分布
- Performance:展示阅读量等性能数据趋势
- Scout:展示候选选题的分数和来源分布
如何复现
最小可用版仅需3个脚本约500行代码:
1. 安装Hermes Agent
hermes setup # 交互式配置
2. 编写核心脚本
# 模式统一:1. 读输入 2. 调LLM 3. 写输出
input_data = read_json("queue/pending/scout_results.json")
result = llm_call(prompt, input_data)
write_json(f"queue/pending/{slot}/xxx.meta.json", result)
3. 用文件命名约定串联脚本
scout_results.json → YYYYMMDD-HHMMSS-article.md + .meta.json → 移至 published/
4. 配置cron定时任务
# crontab -e
30 5 * * * /path/cron-pipeline.sh prepare 07:00 1 2 # 早高峰
30 10 * * * /path/cron-pipeline.sh prepare 12:00 1 2 # 午休
0 16 * * * /path/cron-pipeline.sh prepare 18:00 2 3 # 晚高峰
30 19 * * * /path/cron-pipeline.sh prepare 21:00 0 2 # 睡前
核心启示
- 不要从头造轮子:善用现有工具和框架快速搭建
- 文件即队列:简单直接,避免过度工程化
- 人在回路中:自动化流程,人工最终确认
- 数据驱动:从数据中学习,持续优化
效果
一个人配合几个AI Agent,可以有效顶替一个小型内容团队,实现高效、高质量的内容自动化生产。
参考来源:自动化内容生产线总结:使用Hermes与5个Agent每日高效发布
标签:#Hermes #自动化 #内容生产 #AI Agent #效率工具