XL X Article Library Chinese field notes
返回书架

Agent / 2026-05-31

Hermes Agent 大师课:从零到完整自主 Agent 运行

阅读进度 0%

作者
CyrilXBT(@cyrilXBT)
来源
X 原帖
文章
X Article
Markdown
下载

作者认为,很多人第一次接触 Hermes Agent 时会困惑,并不是因为 Hermes 本身复杂,而是缺少一篇能从零知识一路带到完整自主 agent 系统的完整指南。

这篇文章的目标,是让读者完成一套从安装、配置、写第一个 skill、连接 MCP server、建立持久记忆、自动化 workflow,到部署多 agent 运行系统的完整路径。

1. Hermes Agent 到底是什么

作者把 Hermes Agent 定义为一个开源自主 AI agent 框架。它不是普通聊天机器人,也不是某个工具的简单包装层,而是用于构建持续运行、跨会话记忆、可复用 workflow、并能按计划自动执行任务的 agent 基础设施。

它有四个关键特性:

  1. 持久记忆
  2. 普通 AI agent 关闭会话后就忘记上下文。Hermes 会把对话、任务、输出和决策写入记忆层,后续会话可以继续使用。

  1. Skill 系统
  2. Hermes 执行被称为 skill 的可复用工作流文件。skill 是 Markdown 文件,描述 agent 应该做什么。写一次之后,后续可以反复调用。

  1. 计划任务自动化
  2. Hermes 可以按配置的时间自动运行,比如晨间研究简报、夜间内容处理、每小时来源监控等。

  1. MCP 集成
  2. 通过 Model Context Protocol server,Hermes 可以连接真实工具,如文件系统、数据库、网页搜索、API 和外部服务。

作者的结论是:Hermes 不是一个“你使用的工具”,而是一个“会运行的系统”。

2. 安装与初始设置

原文要求的前置条件包括:Node.js 18 或更高版本、Git,以及能熟练使用终端。

作者给出的安装流程是:克隆 Hermes 仓库,进入目录,安装依赖,复制 .env.example.env,然后在 .env 中配置模型提供商、API key、记忆后端、调度器、日志等级和日志路径。

配置项大致包括:

  • 主模型提供商,例如 Anthropic。
  • 模型名称,例如 Claude 系列模型。
  • API key。
  • SQLite 记忆后端和 memory.db 路径。
  • 是否启用 scheduler。
  • 时区。
  • 日志路径。

启动后,Hermes 应显示类似信息:记忆后端已初始化、skill 目录已加载、scheduler 已启用、agent 已准备好接收指令。

作者建议用第一条消息测试安装是否成功:询问 Hermes 对自身配置、记忆状态和可用 skill 的了解。

3. 文件架构

作者给出的 Hermes 项目结构包括:

  • skills/:所有 workflow 文件,每个 skill 是一个 Markdown 文件。
  • data/:处理数据、输出和 SQLite 记忆数据库。
  • logs/:运行日志。
  • config/:来源配置和调度配置。
  • CLAUDE.md:最重要的上下文文件。
  • .env:环境变量。
  • package.json:项目配置。

其中 CLAUDE.md 被作者称为整个安装中最重要的文件,因为它告诉 Hermes 你是谁、你做什么、你希望 agent 如何运行。

4. 编写 CLAUDE.md

CLAUDE.md 是 Hermes agent 的“运行宪法”。每个 skill 执行前都会读取它,每个自动化 workflow 都会使用它提供上下文,每个输出都会被它塑形。

一个差的 CLAUDE.md 会产生通用输出;一个精确的 CLAUDE.md 会让结果像来自真正理解你业务的人。

作者建议在里面写清楚:

  • 身份:姓名或品牌、角色、主要平台、服务对象。
  • 内容与工作焦点:主题、内容格式、语气、绝不做什么。
  • 当前项目:每个项目的状态和下一步行动。
  • 当前优先级:最重要的三件事。
  • 内容标准:优秀、可接受、应拒绝的输出分别是什么。
  • 可信来源:你信任的出版物、频道和人物。
  • 不想要的主题、格式或方法。
  • 记忆规则:存储重大决策、跟踪已发布内容、记住来源质量、避免短时间重复同一来源。
  • 输出规则:输出保存位置、文件命名、日志记录、人类审核标记。
  • 更新计划:多久复查一次这个文件。

作者建议在写任何 skill 之前,先花 30 分钟认真填完 CLAUDE.md

5. 构建第一个 Skill

在 Hermes 中,skill 是描述 workflow 的 Markdown 文件。作者给出的基本结构包括四部分:

  • Purpose:这个 skill 做什么。
  • Trigger:如何触发,手动或定时。
  • Process:Hermes 应执行的步骤。
  • Output:产出什么,保存到哪里。

示例 skill 是一个 morning briefing:每天早上读取配置来源,筛选过去 24 小时的重要发展,结合 CLAUDE.md 和记忆层,生成结构化晨间简报。

简报结构包括:

  • 今日最重要的一件事。
  • 发生了什么。
  • 值得继续观察的情况。
  • 与历史记忆的连接。
  • 今日建议重点。

输出保存到 data/outputs/,并写入记忆,打上类似 daily-brief 的标签。

6. 记忆系统

作者认为,记忆系统是 Hermes 从“有能力的工具”变成“复利系统”的关键。

每个重要操作都会生成一条 SQLite 记忆记录,包含:

  • 内容。
  • 标签。
  • 时间戳。
  • 来源 skill。
  • 相关性分数。

当任何 skill 运行时,Hermes 会先检索相关记忆,作为执行上下文。检索使用语义相似度,因此即使关键词不完全相同,也能找到相关内容。

作者建议每个 skill 都显式写出记忆规则:执行前检索哪些历史记录,执行后存储哪些发现、决策和输出。

记忆的复利在于:一周记忆的 Hermes 已经有用;三个月记忆的 Hermes 会成为另一类工具,因为它已经读过大量来源、处理过大量内容、跟踪过许多决策,并逐步知道什么对你的具体工作有效。

7. 连接 MCP Servers

MCP server 让 Hermes 从“能思考世界的 agent”变成“能对世界采取行动的 agent”。

原文提到的核心 MCP 包括:

  • Filesystem MCP:读写本地文件。
  • Brave Search MCP:实时网页搜索。
  • GitHub MCP:访问代码仓库。
  • Puppeteer MCP:浏览器自动化。

作者强调,Filesystem MCP 是最马上有价值的连接,因为它让 Hermes 能读取指定文件、写输出、更新索引、监控文件夹。

Brave Search MCP 让 Hermes 可以检索实时信息,适用于研究、监控和简报类 skill。GitHub MCP 则适合开发者工具内容、开源项目监控、技术研究和仓库分析。

作者建议连接后询问 Hermes 当前连接了哪些 MCP server,以及每个 server 提供哪些工具,以确认配置成功。

8. Scheduler 系统

Scheduler 把 Hermes 从“你主动调用的工具”变成“持续运行的系统”。

作者建议在 config/schedule.json 中定义定时任务,例如:

  • 每天 6 点:morning briefing。
  • 每 2 小时:source monitor。
  • 每晚 8 点:content processor。
  • 每周日 7 点:weekly review。
  • 每晚 11 点:memory consolidation。

作者认为每套 Hermes operation 都需要五个计划工作流:

  1. 晨间简报:读取来源、生成情报、设定当天重点。
  2. 来源监控:定期检查新内容,加入处理队列。
  3. 内容处理:处理当天捕获内容,生成输出,更新记忆。
  4. 每周复盘:综合一周活动,识别模式和洞察。
  5. 记忆合并:去重、更新相关性分数、整理记忆。

9. 构建完整内容系统

作者用 Hermes 构建了一个自动化内容操作系统。目标是:监控来源、识别内容机会、生成草稿、管理发布队列。

配置来源

config/sources.json 中定义来源,例如 Anthropic Blog、GitHub Trending AI、Hacker News 等,并为每个来源设置类型、URL、优先级和检查频率。

内容机会识别器

创建 content-opportunity skill。它读取 CLAUDE.md 中的内容支柱和受众,读取 source monitor 标记的新内容,并为每条新内容评估病毒潜力:

  • 受众是否关心?
  • 是否是真正新信息?
  • 是否连接到内容支柱?
  • 是否能找到独特角度?

得分高于阈值的内容进入 content-queue.md,并写入记忆。

草稿生成器

创建 draft-generator skill。它读取内容队列,选择优先级最高的内容,做实时研究,检查记忆中是否覆盖过该主题,然后按不同格式生成草稿,如 tweet、thread、article。

表现追踪器

创建 performance-tracker skill。它记录内容表现,分析哪些主题、格式、来源效果最好,并在模式明显时更新 CLAUDE.md 的内容优先级。

10. 多 Agent 运行

作者认为,单 agent Hermes 已经强大,多 agent Hermes 则是另一类能力。

多 agent operation 指多个专门化 Hermes 实例各自负责一个领域,共享记忆,并协调输出。

示例四 agent 内容系统:

  • Research Agent:监控来源、识别机会、做深度研究,只读取,不创作。
  • Production Agent:接收研究结果,生成内容草稿,只创作,不发布。
  • Quality Agent:根据标准审查输出,批准或退回,不创作、不发布。
  • Distribution Agent:接收批准内容,管理发布计划,只发布,不创作。

每个 agent 有独立的 CLAUDE.md 和 skills,但都指向同一个 SQLite 记忆数据库。这样研究结果能被生产读取,生产输出能被质量审查读取,质量批准能被分发 agent 读取。

handoff 通过记忆标签完成:

  • ready-for-production
  • ready-for-quality
  • ready-for-distribution
  • published

作者还建议创建一个 orchestrator skill,每 30 分钟检查流水线状态,发现卡住超过 4 小时的项目时标记为 stalled 并提醒人工检查。

11. 高级 Skill 模式

随着系统成熟,基础 skill 格式不够用。作者列出四类高级模式:

  1. 条件执行
  2. 根据条件走不同路径。如果条件不清楚,则标记人工审核。

  1. 重试逻辑
  2. 对每个项目最多尝试多次。主方案失败后切换备用方案,仍失败则标记失败并等待审核。不要在不完整或不确定时继续产出。

  1. 质量门槛
  2. 在保存任何输出前,用明确标准评估。通过则保存;失败则尝试修订;多次修订失败则写入 review-needed/ 并附失败说明。

  1. 记忆驱动执行
  2. 执行前检索此前运行、表现数据和模式笔记。用这些信息避免失败方案、优先采用成功方案,并在执行后记录新观察。

12. 常见问题排查

原文列出了一些早期最常见问题:

  • Scheduler 没有执行:检查 .env 中是否启用 scheduler,检查 cron 表达式和日志。
  • 记忆没有跨会话持久化:检查 MEMORY_PATHdata/ 目录写权限。
  • MCP server 没有连接:检查全局安装、API key、.env 配置,并重启 Hermes。
  • skill 输出质量低:通常是 CLAUDE.md 太模糊,或者 skill 的 Process 部分不够具体。
  • Hermes 使用过时信息:检查 Brave Search MCP 是否连接。
  • skill 运行但没有保存输出:检查 Filesystem MCP 路径和输出路径是否正确。

13. 衡量和改进 operation

作者认为,如果 Hermes operation 不随时间改善,就说明记忆系统没有被正确使用。

他建议创建 weekly-review skill,每周日运行,读取过去 7 天所有记忆,分析:

  • 哪些 skill 无错误运行。
  • 哪些 skill 出错。
  • 哪些 skill 输出最好。
  • 哪些 skill 需要改进。
  • 哪些内容表现最好。
  • 高表现内容有什么模式。
  • 记忆记录是否足够完整。
  • 检索出的记忆是否相关。

重要指标包括:

  • skill reliability rate:计划任务无错误运行比例,目标高于 95%。
  • memory retrieval relevance:运行 skill 时检索出的记忆是否真的相关。
  • output quality consistency:输出是否稳定达到标准。
  • operation coverage:目标 workflow 中已有多少比例被自动化。

14. 90 天搭建计划

作者把成熟 Hermes operation 的构建分为 90 天。

第 1 到 7 天:基础

安装 Hermes,写好 CLAUDE.md,构建 morning briefing skill,连接 Filesystem 和 Brave Search MCP,跑第一次定时简报。

目标:Hermes 稳定运行,并每天产出一个有用输出。

第 8 到 30 天:核心 Skill

为你的具体操作构建 5 到 8 个核心 skill,配置五个标准自动化 workflow,找到第一个与你领域相关的 MCP server。

目标:自动化 30% 的重复性知识工作。

第 31 到 60 天:优化

检查记忆质量,改进存储约定,根据三到四周结果优化 skill 输出,并构建带条件执行和质量门槛的高级 skill。

目标:Hermes 输出稳定达到质量标准,不需要大量人工修订。

第 61 到 90 天:多 Agent

如果你的 operation 足够复杂,设计多 agent 架构,编写各个 specialist agent 的 CLAUDE.md,配置共享记忆层,部署 orchestrator skill。

目标:Hermes 能协调多 agent,端到端处理复杂 workflow。

最终观点

作者认为,今天开始并连续运行 90 天的人,会拥有后来者无法快速复制的系统。

原因不是技术难以获得,而是 90 天持续运行积累的记忆层无法跳过。到第 90 天,Hermes 已经知道哪些来源对你的受众最好、哪些方法有效、哪些失败过,也了解你的语气、标准和优先级,因为它已经围绕这些规则执行了数百次。

这份累积智能就是护城河。

每运行一天,护城河就更深。每晚一个自动 workflow 在你不参与的情况下完成,复利就从那里开始。