11.1. 从 Hermes 看 Agent 操作系统的演进方向
从 Hermes 看 Agent 操作系统的演进方向
2026 年 2 月,Nous Research 在 GitHub 上发布了 Hermes Agent。它不是传统意义上的编码副驾驶,也不是对大语言模型的简单聊天封装。它以约 35 000 行 Python 代码构建起了一个自改进闭环:在与用户的每一次交互中自动提取知识、生成可复用的技能文档,并通过周期性“复盘 nudge”持续固化经验。短短四个月后,社区已贡献超过 660 个技能,支持 11 种模型家族和 6 种运行后端。
这个现象背后隐藏着一个越来越清晰的趋势——AI Agent 正在从“一次性的对话机器人”演化为一种持续存在、自我进化、跨平台运行的“操作系统级”基础设施。而 Hermes 的设计,恰好为我们理解这场演进提供了最直观的解剖样本。读完这一章,你将能够识别 Agent 操作系统正在向着三个关键方向收敛,并在自己的选型和技术路线中为这些变化预留接口。
核心维度一:统一内存与技能市场——从孤岛记忆到可交易的认知资产
今天的 Agent 普遍面临“失忆症”:每次新会话都要重新建立上下文,学到的经验无法在不同 Agent 实例间共享。Hermes 从两个层面重塑了记忆体系,也由此指向了 Agent 操作系统最根本的演进方向:持久化、可检索、可迁移的统一认知空间。
在短期层,Hermes 使用 SQLite FTS5 全文搜索引擎来构建本地记忆索引,而非依赖外部向量数据库。每一次交互的内容都会被序列化为结构化文件,FTS5 负责在后续任务中快速召回相关片段。同时,它通过 LLM 摘要机制对“过期”会话生成压缩概览,保证在上下文窗口有限的情况下仍然能保留关键信息。这种设计让记忆不再是“本轮对话的残影”,而成为 Agent 的文件系统级别的持久资源。
在长期层,Hermes 引入了 Honcho 这一辩证式用户建模组件。Honcho 会根据交互历史不断修正对用户偏好、思维习惯和决策模式的假设,逐步构建一个不断更新的“用户模型”。虽然该组件的实现仍在快速迭代中,但它代表了一个重要转变:Agent 不再只是被动检索记忆片段,而是主动形成关于用户的持久概念,并将这一模型用于后续所有跨会话的推理。
| 记忆方案 | 传统 Chat Agent | Hermes 实践 | 演进方向(Agent OS) |
|---|---|---|---|
| 短期存储 | 仅内存中的滑动窗口 | FTS5 全文搜索 + 文件持久化 | 统一文件/对象存储,标准化接口 |
| 长期存储 | 无 / 外部数据库手动注入 | LLM 摘要 + Honcho 用户建模 | 可跨 Agent 迁移的用户画像 |
| 知识复用 | 无 | 自动生成技能文档,存入共享库 | 社区技能市场,付费/积分交易 |
| 作者的结论 | 用完即弃 | 记忆开始基座化,但技能生态仍早期 | 认知资产可封装、可授权、可货币化 |
技能封存是记忆体系向“市场”延伸的自然结果。Hermes 每当成功完成一个复杂任务,就会自动生成一份结构化的技能文档,存入本地的 Skills 目录。其他 Hermes 实例(或者同一个 Agent 在日后)可以直接加载这份技能来复现整个工作流。当前社区已经在一个类似“应用商店”的雏形中共享技能,但从调研资料看,这还缺少统一的版本管理、可信验证和经济激励——而这三个要素,恰好是 Agent 操作系统下一步必须解决的基础设施问题。
核心维度二:自适应推理与边缘部署——模型无关性与休眠即忘的终结
如果 Agent 真的要像操作系统一样无处不在,它就必须摆脱对单一模型提供商的依赖,同时打破“必须绑定在个人电脑上才能持续运行”的物理约束。Hermes 在这两方面都给出了可操作的工程示范。
在模型抽象层,Hermes 实现了一条简单的 CLI 命令 hermes model 即可在 OpenAI、OpenRouter、Nous Portal、MiMo、GLM 等多家模型间热切换。底层逻辑是将推理调用封装为提供商无关的协议适配层,模型选择完全对应用逻辑透明。这对于 Agent 操作系统的意义在于:未来服务端 Agent 可以根据任务难度、成本、时延和隐私要求动态路由到不同模型,甚至在同一任务的不同阶段组合使用本地量化模型和云端大模型。
在部署后端上,Hermes 支持本地进程、Docker、SSH、Singularity、Modal 和 Daytona 六种模式。其中 Modal 和 Daytona 尤其值得注意:它们提供了一种“休眠-唤醒”机制——当 Agent 空闲时近乎零成本地停止计费,有请求进入时拉起实例并恢复记忆状态。这实现了“常驻而不常费”的运行形态,为 Agent 操作系统的去中心化持久运行扫清了成本障碍。
# 在 Hermes 中切换到本地量化模型(示例)
hermes model set nous-hermes-2:7b-q4_K_M
# Agent 将在本地 llama.cpp 后端运行,无需联网
面向边缘和离线场景的量化推理正在成为必选项。Hermes 尚未在核心代码中直接捆绑模型量化引擎,但其架构设计已将“推理后端”与“Agent 核心逻辑”彻底解耦。这意味着社区可以方便地接入 llama.cpp、MLC-LLM 等本地运行时。Agent 操作系统的下一步,必然是在安装包中内置量化模型管理服务,允许用户一键启用“飞行模式”,并自动完成推理任务的本地-云端拆分。
| 运行模式 | 典型传统 Agent | Hermes 实践 | 未来 Agent OS 所必须具备的 |
|---|---|---|---|
| 模型绑定 | 强耦合单一 API | 热切换,模型无关命令 | 动态模型路由,任务感知调度 |
| 在线要求 | 必须长连接 | 离线可用(本地模式) | 本地优先,云端增强 |
| 部署弹性 | 单机常驻 | 休眠唤醒,6 种后端 | 跨节点迁移,边缘协同 |
| 成本模型 | 按 Token 付费 | 本地免费/云端按量 | 混合计费,基于任务 SLA |
| 作者的结论 | 绑定就是风险 | 灵活但不自动优化 | 自主构建最优推理拓扑 |
核心维度三:安全与伦理框架的成熟——从临时审查到系统级治理
当 Agent 能够自主访问文件系统、执行远程命令、甚至代替用户发送消息时,安全问题就不再是“要不要加个审批按钮”的 UI 问题,而是操作系统级别的资源隔离与权限管理问题。
Hermes 目前的安全边界由三部分组成:命令审批机制(执行前需用户确认)、工具过滤器(可通过 MCP 协议限制外部服务的可调用范围)和容器化隔离(推荐在 Docker 或 Singularity 中运行)。这三层构成了一条从“人工介入”到“自动拒绝”的渐进式安全链。但其粗粒度仍然明显——缺乏基于意图的行为异常检测,也没有跨会话的安全审计日志标准。
调研资料中提到了一个尚未完全确认但方向明确的趋势:Hermes 社区正在讨论引入基于信用分级的自适应权限控制。具体而言,Agent 会依据某用户历史中的合规行为,动态调高其自动执行权限的阈值;而对于高风险操作,则回退到硬性安全边界。这种机制的底层思路很像操作系统中 sudo 的超时缓存或 smart-approval,但要求更丰富的上下文和持续性风险评估。
伦理审查同样被嵌入到 Hermes 的技能创建流程。每当 Agent 自动生成一个新的技能文档,都会附带一份“自我评估摘要”,描述该技能的输入、输出、潜在风险和使用限制。这些元数据如果能够标准化,未来就会成为技能市场中合规校验的数据基础。可以预见,一年内我们会看到类似技能安全等级标签(如 L0: 纯信息检索、L1: 需确认的文件读写、L2: 受限外部 API 调用)出现在开源 Agent 的生态中。
// 未来技能安全描述的可能范式(虚构,基于 Hermes 现有方向推演)
{
"skill_name": "daily_report_generator",
"security_level": "L1",
"required_permissions": ["file_read", "local_write"],
"risk_summary": "仅读取指定目录下的日志,产出本地报告。不涉及网络传输。",
"last_security_review": "2026-06-10"
}
结论先行:Agent 操作系统不是一种产品,而是一套约定
如果要从 Hermes 的工程实践中提炼出一句话,那就是:Agent 操作系统的内核不是代码,而是对“自主进化、跨平台连续性、治理标准化”这三个原则的系统性承诺。 它不是某个公司发布的下一个框架版本,而是整个生态正在共同形成的技术与社会契约。
为了方便判断你目前所处的技术位置,下面用一张基于当前调研资料的对比表来概括传统 Agent、Hermes 以及未来的 Agent OS。
| 特征 | 传统 LLM Agent | Hermes Agent(2026.02起) | 演进中的 Agent OS |
|---|---|---|---|
| 学习机制 | 无,或手动 Fine-tune | 自动技能生成、周期性 Nudge | 自进化集群,跨实例遗传算法 |
| 记忆体系 | 单会话滑动窗口 | FTS5 + LLM 摘要 + Honcho | 统一身份层,标准化认知存储协议 |
| 部署模型 | 云端 API 绑定 | 6 种后端,本地/休眠 | 边缘设备优先,任务驱动弹性伸缩 |
| 技能复用 | 无 | 社区共享 Skills 目录 | 开放技能市场,含支付与声誉系统 |
| 安全模型 | 仅命令审批 | 审批 + 工具过滤 + 容器 | 动态信用分权限、系统级审计、技能安全等级 |
| 跨平台存在 | 单平台 Bot | 统一多通道网关 | 全平台持续在场,会话无缝迁移 |
| 作者的结论 | 工具阶段 | 从工具到平台的中途岛 | 下一代的认知基础设施 |
按场景推荐:你现在可以为演进做什么
无论你是一名独立开发者、技术负责人还是架构师,下面这些可操作的建议都基于 Hermes 已曝光的能力和当前调研资料中可确认的趋势,你可以立刻开始实践。
个人开发者 / 早期采用者
- 立刻在本地部署一个 Hermes Agent,亲自跑通“任务→自动生成技能→下次复用”这个闭环,感受 FTS5 记忆检索和周期性 Nudge 的实际行为。
- 尝试在
hermes model set中切换到本地量化模型,体验离线推理与云端推理的能力边界,为后续的混合推理积累直觉。 - 关注 Hermes 技能市场的标准化讨论,将自己的一两个常用工作流封装成技能,加入社区仓库。
中小技术团队
- 在内部选择一个非关键业务场景,用 Hermes 的 cron 调度功能让 Agent 自主完成周期性任务(如日报生成、监控告警汇总),替代部分脚本。
- 要求任何新引入的 Agent 框架必须提供多后端部署能力和模型无关的抽象层,这两点将直接决定未来 3 个季度内的迁移成本。
- 建立内部技能库,用 Git 管理 Skills 目录,为每一份技能文档添加安全风险描述——这比等待行业标准出现更实际。
企业架构决策者
- 将“Agent 运行时”列为与容器运行时并列的基础设施能力,开始评估支持休眠唤醒、跨节点迁移的部署方案(例如 Daytona 或 Modal 模式)。
- 在安全策略中补充 Agent 专用条款:要求所有 Agent 至少实现命令审批 + 工具过滤 + 资源隔离三层防护,并准备转换为基于信用分/行为反馈的动态权限模型。
- 要求任何采购或引入的 Agent 产品支持记忆自主权的导出与迁移,避免被单一厂商的封闭记忆层锁定。
当你带着这些实践回到自己的技术栈中,会发现一个微妙的变化:你今天对 Agent 框架所做的每一次选型,其实都是在为未来的 Agent OS 投下信任票。而下一章,我们将从个体实践走向群体共创——深入 Hermes 的社区贡献体系,看看如何把你的技能、补丁和想法变成这个生态系统里真正运转的部件。
Hermes Agent 系统设计与工程落地
关于 LearnKu