Agent / 2026-05-31
Hermes Agent 大师课:从零到完整自主 Agent 运行
阅读进度 0%
作者认为,很多人第一次接触 Hermes Agent 时会困惑,并不是因为 Hermes 本身复杂,而是缺少一篇能从零知识一路带到完整自主 agent 系统的完整指南。
这篇文章的目标,是让读者完成一套从安装、配置、写第一个 skill、连接 MCP server、建立持久记忆、自动化 workflow,到部署多 agent 运行系统的完整路径。
1. Hermes Agent 到底是什么
作者把 Hermes Agent 定义为一个开源自主 AI agent 框架。它不是普通聊天机器人,也不是某个工具的简单包装层,而是用于构建持续运行、跨会话记忆、可复用 workflow、并能按计划自动执行任务的 agent 基础设施。
它有四个关键特性:
- 持久记忆
普通 AI agent 关闭会话后就忘记上下文。Hermes 会把对话、任务、输出和决策写入记忆层,后续会话可以继续使用。
- Skill 系统
Hermes 执行被称为 skill 的可复用工作流文件。skill 是 Markdown 文件,描述 agent 应该做什么。写一次之后,后续可以反复调用。
- 计划任务自动化
Hermes 可以按配置的时间自动运行,比如晨间研究简报、夜间内容处理、每小时来源监控等。
- MCP 集成
通过 Model Context Protocol server,Hermes 可以连接真实工具,如文件系统、数据库、网页搜索、API 和外部服务。
作者的结论是:Hermes 不是一个“你使用的工具”,而是一个“会运行的系统”。
2. 安装与初始设置
原文要求的前置条件包括:Node.js 18 或更高版本、Git,以及能熟练使用终端。
作者给出的安装流程是:克隆 Hermes 仓库,进入目录,安装依赖,复制 .env.example 为 .env,然后在 .env 中配置模型提供商、API key、记忆后端、调度器、日志等级和日志路径。
配置项大致包括:
- 主模型提供商,例如 Anthropic。
- 模型名称,例如 Claude 系列模型。
- API key。
- SQLite 记忆后端和
memory.db路径。 - 是否启用 scheduler。
- 时区。
- 日志路径。
启动后,Hermes 应显示类似信息:记忆后端已初始化、skill 目录已加载、scheduler 已启用、agent 已准备好接收指令。
作者建议用第一条消息测试安装是否成功:询问 Hermes 对自身配置、记忆状态和可用 skill 的了解。
3. 文件架构
作者给出的 Hermes 项目结构包括:
skills/:所有 workflow 文件,每个 skill 是一个 Markdown 文件。data/:处理数据、输出和 SQLite 记忆数据库。logs/:运行日志。config/:来源配置和调度配置。CLAUDE.md:最重要的上下文文件。.env:环境变量。package.json:项目配置。
其中 CLAUDE.md 被作者称为整个安装中最重要的文件,因为它告诉 Hermes 你是谁、你做什么、你希望 agent 如何运行。
4. 编写 CLAUDE.md
CLAUDE.md 是 Hermes agent 的“运行宪法”。每个 skill 执行前都会读取它,每个自动化 workflow 都会使用它提供上下文,每个输出都会被它塑形。
一个差的 CLAUDE.md 会产生通用输出;一个精确的 CLAUDE.md 会让结果像来自真正理解你业务的人。
作者建议在里面写清楚:
- 身份:姓名或品牌、角色、主要平台、服务对象。
- 内容与工作焦点:主题、内容格式、语气、绝不做什么。
- 当前项目:每个项目的状态和下一步行动。
- 当前优先级:最重要的三件事。
- 内容标准:优秀、可接受、应拒绝的输出分别是什么。
- 可信来源:你信任的出版物、频道和人物。
- 不想要的主题、格式或方法。
- 记忆规则:存储重大决策、跟踪已发布内容、记住来源质量、避免短时间重复同一来源。
- 输出规则:输出保存位置、文件命名、日志记录、人类审核标记。
- 更新计划:多久复查一次这个文件。
作者建议在写任何 skill 之前,先花 30 分钟认真填完 CLAUDE.md。
5. 构建第一个 Skill
在 Hermes 中,skill 是描述 workflow 的 Markdown 文件。作者给出的基本结构包括四部分:
- Purpose:这个 skill 做什么。
- Trigger:如何触发,手动或定时。
- Process:Hermes 应执行的步骤。
- Output:产出什么,保存到哪里。
示例 skill 是一个 morning briefing:每天早上读取配置来源,筛选过去 24 小时的重要发展,结合 CLAUDE.md 和记忆层,生成结构化晨间简报。
简报结构包括:
- 今日最重要的一件事。
- 发生了什么。
- 值得继续观察的情况。
- 与历史记忆的连接。
- 今日建议重点。
输出保存到 data/outputs/,并写入记忆,打上类似 daily-brief 的标签。
6. 记忆系统
作者认为,记忆系统是 Hermes 从“有能力的工具”变成“复利系统”的关键。
每个重要操作都会生成一条 SQLite 记忆记录,包含:
- 内容。
- 标签。
- 时间戳。
- 来源 skill。
- 相关性分数。
当任何 skill 运行时,Hermes 会先检索相关记忆,作为执行上下文。检索使用语义相似度,因此即使关键词不完全相同,也能找到相关内容。
作者建议每个 skill 都显式写出记忆规则:执行前检索哪些历史记录,执行后存储哪些发现、决策和输出。
记忆的复利在于:一周记忆的 Hermes 已经有用;三个月记忆的 Hermes 会成为另一类工具,因为它已经读过大量来源、处理过大量内容、跟踪过许多决策,并逐步知道什么对你的具体工作有效。
7. 连接 MCP Servers
MCP server 让 Hermes 从“能思考世界的 agent”变成“能对世界采取行动的 agent”。
原文提到的核心 MCP 包括:
- Filesystem MCP:读写本地文件。
- Brave Search MCP:实时网页搜索。
- GitHub MCP:访问代码仓库。
- Puppeteer MCP:浏览器自动化。
作者强调,Filesystem MCP 是最马上有价值的连接,因为它让 Hermes 能读取指定文件、写输出、更新索引、监控文件夹。
Brave Search MCP 让 Hermes 可以检索实时信息,适用于研究、监控和简报类 skill。GitHub MCP 则适合开发者工具内容、开源项目监控、技术研究和仓库分析。
作者建议连接后询问 Hermes 当前连接了哪些 MCP server,以及每个 server 提供哪些工具,以确认配置成功。
8. Scheduler 系统
Scheduler 把 Hermes 从“你主动调用的工具”变成“持续运行的系统”。
作者建议在 config/schedule.json 中定义定时任务,例如:
- 每天 6 点:morning briefing。
- 每 2 小时:source monitor。
- 每晚 8 点:content processor。
- 每周日 7 点:weekly review。
- 每晚 11 点:memory consolidation。
作者认为每套 Hermes operation 都需要五个计划工作流:
- 晨间简报:读取来源、生成情报、设定当天重点。
- 来源监控:定期检查新内容,加入处理队列。
- 内容处理:处理当天捕获内容,生成输出,更新记忆。
- 每周复盘:综合一周活动,识别模式和洞察。
- 记忆合并:去重、更新相关性分数、整理记忆。
9. 构建完整内容系统
作者用 Hermes 构建了一个自动化内容操作系统。目标是:监控来源、识别内容机会、生成草稿、管理发布队列。
配置来源
在 config/sources.json 中定义来源,例如 Anthropic Blog、GitHub Trending AI、Hacker News 等,并为每个来源设置类型、URL、优先级和检查频率。
内容机会识别器
创建 content-opportunity skill。它读取 CLAUDE.md 中的内容支柱和受众,读取 source monitor 标记的新内容,并为每条新内容评估病毒潜力:
- 受众是否关心?
- 是否是真正新信息?
- 是否连接到内容支柱?
- 是否能找到独特角度?
得分高于阈值的内容进入 content-queue.md,并写入记忆。
草稿生成器
创建 draft-generator skill。它读取内容队列,选择优先级最高的内容,做实时研究,检查记忆中是否覆盖过该主题,然后按不同格式生成草稿,如 tweet、thread、article。
表现追踪器
创建 performance-tracker skill。它记录内容表现,分析哪些主题、格式、来源效果最好,并在模式明显时更新 CLAUDE.md 的内容优先级。
10. 多 Agent 运行
作者认为,单 agent Hermes 已经强大,多 agent Hermes 则是另一类能力。
多 agent operation 指多个专门化 Hermes 实例各自负责一个领域,共享记忆,并协调输出。
示例四 agent 内容系统:
- Research Agent:监控来源、识别机会、做深度研究,只读取,不创作。
- Production Agent:接收研究结果,生成内容草稿,只创作,不发布。
- Quality Agent:根据标准审查输出,批准或退回,不创作、不发布。
- Distribution Agent:接收批准内容,管理发布计划,只发布,不创作。
每个 agent 有独立的 CLAUDE.md 和 skills,但都指向同一个 SQLite 记忆数据库。这样研究结果能被生产读取,生产输出能被质量审查读取,质量批准能被分发 agent 读取。
handoff 通过记忆标签完成:
ready-for-productionready-for-qualityready-for-distributionpublished
作者还建议创建一个 orchestrator skill,每 30 分钟检查流水线状态,发现卡住超过 4 小时的项目时标记为 stalled 并提醒人工检查。
11. 高级 Skill 模式
随着系统成熟,基础 skill 格式不够用。作者列出四类高级模式:
- 条件执行
根据条件走不同路径。如果条件不清楚,则标记人工审核。
- 重试逻辑
对每个项目最多尝试多次。主方案失败后切换备用方案,仍失败则标记失败并等待审核。不要在不完整或不确定时继续产出。
- 质量门槛
在保存任何输出前,用明确标准评估。通过则保存;失败则尝试修订;多次修订失败则写入 review-needed/ 并附失败说明。
- 记忆驱动执行
执行前检索此前运行、表现数据和模式笔记。用这些信息避免失败方案、优先采用成功方案,并在执行后记录新观察。
12. 常见问题排查
原文列出了一些早期最常见问题:
- Scheduler 没有执行:检查
.env中是否启用 scheduler,检查 cron 表达式和日志。 - 记忆没有跨会话持久化:检查
MEMORY_PATH和data/目录写权限。 - MCP server 没有连接:检查全局安装、API key、
.env配置,并重启 Hermes。 - skill 输出质量低:通常是
CLAUDE.md太模糊,或者 skill 的 Process 部分不够具体。 - Hermes 使用过时信息:检查 Brave Search MCP 是否连接。
- skill 运行但没有保存输出:检查 Filesystem MCP 路径和输出路径是否正确。
13. 衡量和改进 operation
作者认为,如果 Hermes operation 不随时间改善,就说明记忆系统没有被正确使用。
他建议创建 weekly-review skill,每周日运行,读取过去 7 天所有记忆,分析:
- 哪些 skill 无错误运行。
- 哪些 skill 出错。
- 哪些 skill 输出最好。
- 哪些 skill 需要改进。
- 哪些内容表现最好。
- 高表现内容有什么模式。
- 记忆记录是否足够完整。
- 检索出的记忆是否相关。
重要指标包括:
- skill reliability rate:计划任务无错误运行比例,目标高于 95%。
- memory retrieval relevance:运行 skill 时检索出的记忆是否真的相关。
- output quality consistency:输出是否稳定达到标准。
- operation coverage:目标 workflow 中已有多少比例被自动化。
14. 90 天搭建计划
作者把成熟 Hermes operation 的构建分为 90 天。
第 1 到 7 天:基础
安装 Hermes,写好 CLAUDE.md,构建 morning briefing skill,连接 Filesystem 和 Brave Search MCP,跑第一次定时简报。
目标:Hermes 稳定运行,并每天产出一个有用输出。
第 8 到 30 天:核心 Skill
为你的具体操作构建 5 到 8 个核心 skill,配置五个标准自动化 workflow,找到第一个与你领域相关的 MCP server。
目标:自动化 30% 的重复性知识工作。
第 31 到 60 天:优化
检查记忆质量,改进存储约定,根据三到四周结果优化 skill 输出,并构建带条件执行和质量门槛的高级 skill。
目标:Hermes 输出稳定达到质量标准,不需要大量人工修订。
第 61 到 90 天:多 Agent
如果你的 operation 足够复杂,设计多 agent 架构,编写各个 specialist agent 的 CLAUDE.md,配置共享记忆层,部署 orchestrator skill。
目标:Hermes 能协调多 agent,端到端处理复杂 workflow。
最终观点
作者认为,今天开始并连续运行 90 天的人,会拥有后来者无法快速复制的系统。
原因不是技术难以获得,而是 90 天持续运行积累的记忆层无法跳过。到第 90 天,Hermes 已经知道哪些来源对你的受众最好、哪些方法有效、哪些失败过,也了解你的语气、标准和优先级,因为它已经围绕这些规则执行了数百次。
这份累积智能就是护城河。
每运行一天,护城河就更深。每晚一个自动 workflow 在你不参与的情况下完成,复利就从那里开始。