# Hermes Agent 大师课：从零到完整自主 Agent 运行

原文：Hermes Agent Masterclass: The Complete Course From Zero to Full Autonomous Agent Operation  
作者：CyrilXBT（@cyrilXBT）  
来源：https://x.com/cyrilXBT/status/2060883609935077667  
文章链接：https://x.com/i/article/2060852386651111424  
原文日期：2026-05-31

> 注：原文包含开源项目、安装命令、MCP server、自动化调度、多 agent 架构等具体实现建议。以下按作者文章译述，不代表已核验这些仓库、包名、能力或安全性。实际运行任何安装命令前，应先核验官方仓库、依赖和权限范围。

---

作者认为，很多人第一次接触 Hermes Agent 时会困惑，并不是因为 Hermes 本身复杂，而是缺少一篇能从零知识一路带到完整自主 agent 系统的完整指南。

这篇文章的目标，是让读者完成一套从安装、配置、写第一个 skill、连接 MCP server、建立持久记忆、自动化 workflow，到部署多 agent 运行系统的完整路径。

## 1. Hermes Agent 到底是什么

作者把 Hermes Agent 定义为一个开源自主 AI agent 框架。它不是普通聊天机器人，也不是某个工具的简单包装层，而是用于构建持续运行、跨会话记忆、可复用 workflow、并能按计划自动执行任务的 agent 基础设施。

它有四个关键特性：

1. **持久记忆**  
   普通 AI agent 关闭会话后就忘记上下文。Hermes 会把对话、任务、输出和决策写入记忆层，后续会话可以继续使用。

2. **Skill 系统**  
   Hermes 执行被称为 skill 的可复用工作流文件。skill 是 Markdown 文件，描述 agent 应该做什么。写一次之后，后续可以反复调用。

3. **计划任务自动化**  
   Hermes 可以按配置的时间自动运行，比如晨间研究简报、夜间内容处理、每小时来源监控等。

4. **MCP 集成**  
   通过 Model Context Protocol server，Hermes 可以连接真实工具，如文件系统、数据库、网页搜索、API 和外部服务。

作者的结论是：Hermes 不是一个“你使用的工具”，而是一个“会运行的系统”。

## 2. 安装与初始设置

原文要求的前置条件包括：Node.js 18 或更高版本、Git，以及能熟练使用终端。

作者给出的安装流程是：克隆 Hermes 仓库，进入目录，安装依赖，复制 `.env.example` 为 `.env`，然后在 `.env` 中配置模型提供商、API key、记忆后端、调度器、日志等级和日志路径。

配置项大致包括：

- 主模型提供商，例如 Anthropic。
- 模型名称，例如 Claude 系列模型。
- API key。
- SQLite 记忆后端和 `memory.db` 路径。
- 是否启用 scheduler。
- 时区。
- 日志路径。

启动后，Hermes 应显示类似信息：记忆后端已初始化、skill 目录已加载、scheduler 已启用、agent 已准备好接收指令。

作者建议用第一条消息测试安装是否成功：询问 Hermes 对自身配置、记忆状态和可用 skill 的了解。

## 3. 文件架构

作者给出的 Hermes 项目结构包括：

- `skills/`：所有 workflow 文件，每个 skill 是一个 Markdown 文件。
- `data/`：处理数据、输出和 SQLite 记忆数据库。
- `logs/`：运行日志。
- `config/`：来源配置和调度配置。
- `CLAUDE.md`：最重要的上下文文件。
- `.env`：环境变量。
- `package.json`：项目配置。

其中 `CLAUDE.md` 被作者称为整个安装中最重要的文件，因为它告诉 Hermes 你是谁、你做什么、你希望 agent 如何运行。

## 4. 编写 `CLAUDE.md`

`CLAUDE.md` 是 Hermes agent 的“运行宪法”。每个 skill 执行前都会读取它，每个自动化 workflow 都会使用它提供上下文，每个输出都会被它塑形。

一个差的 `CLAUDE.md` 会产生通用输出；一个精确的 `CLAUDE.md` 会让结果像来自真正理解你业务的人。

作者建议在里面写清楚：

- 身份：姓名或品牌、角色、主要平台、服务对象。
- 内容与工作焦点：主题、内容格式、语气、绝不做什么。
- 当前项目：每个项目的状态和下一步行动。
- 当前优先级：最重要的三件事。
- 内容标准：优秀、可接受、应拒绝的输出分别是什么。
- 可信来源：你信任的出版物、频道和人物。
- 不想要的主题、格式或方法。
- 记忆规则：存储重大决策、跟踪已发布内容、记住来源质量、避免短时间重复同一来源。
- 输出规则：输出保存位置、文件命名、日志记录、人类审核标记。
- 更新计划：多久复查一次这个文件。

作者建议在写任何 skill 之前，先花 30 分钟认真填完 `CLAUDE.md`。

## 5. 构建第一个 Skill

在 Hermes 中，skill 是描述 workflow 的 Markdown 文件。作者给出的基本结构包括四部分：

- Purpose：这个 skill 做什么。
- Trigger：如何触发，手动或定时。
- Process：Hermes 应执行的步骤。
- Output：产出什么，保存到哪里。

示例 skill 是一个 **morning briefing**：每天早上读取配置来源，筛选过去 24 小时的重要发展，结合 `CLAUDE.md` 和记忆层，生成结构化晨间简报。

简报结构包括：

- 今日最重要的一件事。
- 发生了什么。
- 值得继续观察的情况。
- 与历史记忆的连接。
- 今日建议重点。

输出保存到 `data/outputs/`，并写入记忆，打上类似 `daily-brief` 的标签。

## 6. 记忆系统

作者认为，记忆系统是 Hermes 从“有能力的工具”变成“复利系统”的关键。

每个重要操作都会生成一条 SQLite 记忆记录，包含：

- 内容。
- 标签。
- 时间戳。
- 来源 skill。
- 相关性分数。

当任何 skill 运行时，Hermes 会先检索相关记忆，作为执行上下文。检索使用语义相似度，因此即使关键词不完全相同，也能找到相关内容。

作者建议每个 skill 都显式写出记忆规则：执行前检索哪些历史记录，执行后存储哪些发现、决策和输出。

记忆的复利在于：一周记忆的 Hermes 已经有用；三个月记忆的 Hermes 会成为另一类工具，因为它已经读过大量来源、处理过大量内容、跟踪过许多决策，并逐步知道什么对你的具体工作有效。

## 7. 连接 MCP Servers

MCP server 让 Hermes 从“能思考世界的 agent”变成“能对世界采取行动的 agent”。

原文提到的核心 MCP 包括：

- Filesystem MCP：读写本地文件。
- Brave Search MCP：实时网页搜索。
- GitHub MCP：访问代码仓库。
- Puppeteer MCP：浏览器自动化。

作者强调，Filesystem MCP 是最马上有价值的连接，因为它让 Hermes 能读取指定文件、写输出、更新索引、监控文件夹。

Brave Search MCP 让 Hermes 可以检索实时信息，适用于研究、监控和简报类 skill。GitHub MCP 则适合开发者工具内容、开源项目监控、技术研究和仓库分析。

作者建议连接后询问 Hermes 当前连接了哪些 MCP server，以及每个 server 提供哪些工具，以确认配置成功。

## 8. Scheduler 系统

Scheduler 把 Hermes 从“你主动调用的工具”变成“持续运行的系统”。

作者建议在 `config/schedule.json` 中定义定时任务，例如：

- 每天 6 点：morning briefing。
- 每 2 小时：source monitor。
- 每晚 8 点：content processor。
- 每周日 7 点：weekly review。
- 每晚 11 点：memory consolidation。

作者认为每套 Hermes operation 都需要五个计划工作流：

1. 晨间简报：读取来源、生成情报、设定当天重点。
2. 来源监控：定期检查新内容，加入处理队列。
3. 内容处理：处理当天捕获内容，生成输出，更新记忆。
4. 每周复盘：综合一周活动，识别模式和洞察。
5. 记忆合并：去重、更新相关性分数、整理记忆。

## 9. 构建完整内容系统

作者用 Hermes 构建了一个自动化内容操作系统。目标是：监控来源、识别内容机会、生成草稿、管理发布队列。

### 配置来源

在 `config/sources.json` 中定义来源，例如 Anthropic Blog、GitHub Trending AI、Hacker News 等，并为每个来源设置类型、URL、优先级和检查频率。

### 内容机会识别器

创建 `content-opportunity` skill。它读取 `CLAUDE.md` 中的内容支柱和受众，读取 source monitor 标记的新内容，并为每条新内容评估病毒潜力：

- 受众是否关心？
- 是否是真正新信息？
- 是否连接到内容支柱？
- 是否能找到独特角度？

得分高于阈值的内容进入 `content-queue.md`，并写入记忆。

### 草稿生成器

创建 `draft-generator` skill。它读取内容队列，选择优先级最高的内容，做实时研究，检查记忆中是否覆盖过该主题，然后按不同格式生成草稿，如 tweet、thread、article。

### 表现追踪器

创建 `performance-tracker` skill。它记录内容表现，分析哪些主题、格式、来源效果最好，并在模式明显时更新 `CLAUDE.md` 的内容优先级。

## 10. 多 Agent 运行

作者认为，单 agent Hermes 已经强大，多 agent Hermes 则是另一类能力。

多 agent operation 指多个专门化 Hermes 实例各自负责一个领域，共享记忆，并协调输出。

示例四 agent 内容系统：

- Research Agent：监控来源、识别机会、做深度研究，只读取，不创作。
- Production Agent：接收研究结果，生成内容草稿，只创作，不发布。
- Quality Agent：根据标准审查输出，批准或退回，不创作、不发布。
- Distribution Agent：接收批准内容，管理发布计划，只发布，不创作。

每个 agent 有独立的 `CLAUDE.md` 和 skills，但都指向同一个 SQLite 记忆数据库。这样研究结果能被生产读取，生产输出能被质量审查读取，质量批准能被分发 agent 读取。

handoff 通过记忆标签完成：

- `ready-for-production`
- `ready-for-quality`
- `ready-for-distribution`
- `published`

作者还建议创建一个 orchestrator skill，每 30 分钟检查流水线状态，发现卡住超过 4 小时的项目时标记为 stalled 并提醒人工检查。

## 11. 高级 Skill 模式

随着系统成熟，基础 skill 格式不够用。作者列出四类高级模式：

1. **条件执行**  
   根据条件走不同路径。如果条件不清楚，则标记人工审核。

2. **重试逻辑**  
   对每个项目最多尝试多次。主方案失败后切换备用方案，仍失败则标记失败并等待审核。不要在不完整或不确定时继续产出。

3. **质量门槛**  
   在保存任何输出前，用明确标准评估。通过则保存；失败则尝试修订；多次修订失败则写入 `review-needed/` 并附失败说明。

4. **记忆驱动执行**  
   执行前检索此前运行、表现数据和模式笔记。用这些信息避免失败方案、优先采用成功方案，并在执行后记录新观察。

## 12. 常见问题排查

原文列出了一些早期最常见问题：

- Scheduler 没有执行：检查 `.env` 中是否启用 scheduler，检查 cron 表达式和日志。
- 记忆没有跨会话持久化：检查 `MEMORY_PATH` 和 `data/` 目录写权限。
- MCP server 没有连接：检查全局安装、API key、`.env` 配置，并重启 Hermes。
- skill 输出质量低：通常是 `CLAUDE.md` 太模糊，或者 skill 的 Process 部分不够具体。
- Hermes 使用过时信息：检查 Brave Search MCP 是否连接。
- skill 运行但没有保存输出：检查 Filesystem MCP 路径和输出路径是否正确。

## 13. 衡量和改进 operation

作者认为，如果 Hermes operation 不随时间改善，就说明记忆系统没有被正确使用。

他建议创建 `weekly-review` skill，每周日运行，读取过去 7 天所有记忆，分析：

- 哪些 skill 无错误运行。
- 哪些 skill 出错。
- 哪些 skill 输出最好。
- 哪些 skill 需要改进。
- 哪些内容表现最好。
- 高表现内容有什么模式。
- 记忆记录是否足够完整。
- 检索出的记忆是否相关。

重要指标包括：

- skill reliability rate：计划任务无错误运行比例，目标高于 95%。
- memory retrieval relevance：运行 skill 时检索出的记忆是否真的相关。
- output quality consistency：输出是否稳定达到标准。
- operation coverage：目标 workflow 中已有多少比例被自动化。

## 14. 90 天搭建计划

作者把成熟 Hermes operation 的构建分为 90 天。

### 第 1 到 7 天：基础

安装 Hermes，写好 `CLAUDE.md`，构建 morning briefing skill，连接 Filesystem 和 Brave Search MCP，跑第一次定时简报。

目标：Hermes 稳定运行，并每天产出一个有用输出。

### 第 8 到 30 天：核心 Skill

为你的具体操作构建 5 到 8 个核心 skill，配置五个标准自动化 workflow，找到第一个与你领域相关的 MCP server。

目标：自动化 30% 的重复性知识工作。

### 第 31 到 60 天：优化

检查记忆质量，改进存储约定，根据三到四周结果优化 skill 输出，并构建带条件执行和质量门槛的高级 skill。

目标：Hermes 输出稳定达到质量标准，不需要大量人工修订。

### 第 61 到 90 天：多 Agent

如果你的 operation 足够复杂，设计多 agent 架构，编写各个 specialist agent 的 `CLAUDE.md`，配置共享记忆层，部署 orchestrator skill。

目标：Hermes 能协调多 agent，端到端处理复杂 workflow。

## 最终观点

作者认为，今天开始并连续运行 90 天的人，会拥有后来者无法快速复制的系统。

原因不是技术难以获得，而是 90 天持续运行积累的记忆层无法跳过。到第 90 天，Hermes 已经知道哪些来源对你的受众最好、哪些方法有效、哪些失败过，也了解你的语气、标准和优先级，因为它已经围绕这些规则执行了数百次。

这份累积智能就是护城河。

每运行一天，护城河就更深。每晚一个自动 workflow 在你不参与的情况下完成，复利就从那里开始。