Hermes 自动化内容生产线

tech

Hermes 自动化内容生产线

用 Hermes Agent 搭建的全自动内容生产系统,每天推送13篇内容,效率从5小时降至5分钟。

核心架构:5个专职 Agent

系统模拟报社流水线,由5个专职Agent构成:

Agent职责关键技术
Scout选题扫描138个信息源,评分公式筛选
Writer写稿7道工序,100+正则去AI味
Publisher发布Playwright 浏览器自动化
Feedback数据回收阅读数据,反哺选题
Orchestrator调度文件系统当队列,JSON当协议

通信机制

核心设计:文件系统作为队列,JSON文件作为协议

queue/
├── pending/          # 待发布内容
│   ├── 07:00/        # 按时间槽划分
│   │   ├── article.md
│   │   └── article.meta.json  # 元数据
│   ├── 12:00/
│   ├── 18:00/
│   └── 21:00/
├── published/        # 发布成功
└── failed/           # 发布失败

优势:简单直接,文件流转即数据流。项目扩大后可按需引入数据库。

Scout:智能选题

信息源覆盖

  • Twitter KOL:48个(如 @karpathy)
  • RSS订阅:49个(Hacker News, TechCrunch等)
  • GitHub Trending:28个仓库
  • Reddit:13个板块
  • Web搜索:补充

评分公式

总分 = (源质量 ^ 1.3) × 0.22 + 传播潜力 × 0.25 + (新鲜度 × 100) × 0.20

评分维度

  • 源质量:大V账号权重(35)远高于普通RSS源(15),指数1.3放大差距
  • 新鲜度:爆发期(<6小时)加分,已过期(>48小时)扣分
  • 爆款词库:系统自动学习,命中关键词(AI、大模型、agent)加分

Writer:7道质量工序

致力于消除AI味,每篇文章必须”考试及格”:

  1. 抓原文:从URL抓取原始报道,有本地缓存
  2. LLM生成初稿:使用GLM API
  3. AI腔审校(关键步骤):
    • 100多条正则规则,分6大类检测
    • 套话连篇(9条)、AI句式(4条)、书面词汇(10条)
    • 结构机械、态度中立(3条)、细节缺失(6条)
    • 按严重程度扣分(满分100),AI初稿通常30-50分,审校后可达90+分
  4. 批评-修订循环:另一个LLM当”评委”打分,低于70分打回重写,最多改2轮
  5. 排版:中英文加空格、段落加空行、自动加hashtag
  6. 标题优化(仅限长文):生成3个候选标题,选分数最高的
  7. 配图:大模型生图API(美观)或HTML模板渲染信息图(免费)

质量数据示例

{
  "proofread_score": 93,
  "critique_scores": [65, 92],
  "revised": true,
  "title_score": 60,
  "word_count": 564
}

Publisher:模拟真人发布

挑战:头条无发布API,必须实现浏览器自动化

技术方案

  • 使用 Playwright CLI 控制Chromium浏览器
  • 服务器无显示器:安装 Xvfb 虚拟显示器
  • 草稿箱容量:设置自动清理逻辑,超过100篇自动删旧
  • Cookie过期:需手动更新本地Cookie文件

安全策略:所有内容只进草稿箱,绝不直接发布。发布后通知Discord和微信进行人工确认。

Feedback:数据驱动的优化飞轮

数据回收:自动登录头条后台抓取阅读、评论、分享数据

爆款词库:更新 hit_library.json,记录表现好的关键词和标题模式

反哺系统

  • Scout选题时,命中词库的选题获得额外加分
  • Feedback将趋势分析写入 program.md,例如”对比型标题最近表现好”

核心:系统从数据中自主学习什么内容方向更受读者欢迎,形成”选题→写作→发布→数据→优化选题”的飞轮。

Dashboard:系统监控仪表盘

技术实现

  • 后端:Python标准库 HTTPServer(1125行代码)
  • 前端:一个HTML文件用 Tailwind + Chart.js(742行)

5个Tab页面

  1. System Health:展示所有cron任务的时间线和状态
  2. Pipeline:显示每个时间槽内容的状态和质量分数
  3. Quality:展示质量分数趋势、内容方向分布
  4. Performance:展示阅读量等性能数据趋势
  5. Scout:展示候选选题的分数和来源分布

如何复现

最小可用版仅需3个脚本约500行代码

1. 安装Hermes Agent

hermes setup  # 交互式配置

2. 编写核心脚本

# 模式统一:1. 读输入 2. 调LLM 3. 写输出
input_data = read_json("queue/pending/scout_results.json")
result = llm_call(prompt, input_data)
write_json(f"queue/pending/{slot}/xxx.meta.json", result)

3. 用文件命名约定串联脚本

scout_results.jsonYYYYMMDD-HHMMSS-article.md + .meta.json → 移至 published/

4. 配置cron定时任务

# crontab -e
30 5  * * * /path/cron-pipeline.sh prepare 07:00 1 2   # 早高峰
30 10 * * * /path/cron-pipeline.sh prepare 12:00 1 2   # 午休
0  16 * * * /path/cron-pipeline.sh prepare 18:00 2 3   # 晚高峰
30 19 * * * /path/cron-pipeline.sh prepare 21:00 0 2   # 睡前

核心启示

  • 不要从头造轮子:善用现有工具和框架快速搭建
  • 文件即队列:简单直接,避免过度工程化
  • 人在回路中:自动化流程,人工最终确认
  • 数据驱动:从数据中学习,持续优化

效果

一个人配合几个AI Agent,可以有效顶替一个小型内容团队,实现高效、高质量的内容自动化生产。


参考来源:自动化内容生产线总结:使用Hermes与5个Agent每日高效发布


标签:#Hermes #自动化 #内容生产 #AI Agent #效率工具