11.1. 从 Hermes 看 Agent 操作系统的演进方向

从 Hermes 看 Agent 操作系统的演进方向

2026 年 2 月,Nous Research 在 GitHub 上发布了 Hermes Agent。它不是传统意义上的编码副驾驶,也不是对大语言模型的简单聊天封装。它以约 35 000 行 Python 代码构建起了一个自改进闭环:在与用户的每一次交互中自动提取知识、生成可复用的技能文档,并通过周期性“复盘 nudge”持续固化经验。短短四个月后,社区已贡献超过 660 个技能,支持 11 种模型家族和 6 种运行后端。

这个现象背后隐藏着一个越来越清晰的趋势——AI Agent 正在从“一次性的对话机器人”演化为一种持续存在、自我进化、跨平台运行的“操作系统级”基础设施。而 Hermes 的设计,恰好为我们理解这场演进提供了最直观的解剖样本。读完这一章,你将能够识别 Agent 操作系统正在向着三个关键方向收敛,并在自己的选型和技术路线中为这些变化预留接口。

核心维度一:统一内存与技能市场——从孤岛记忆到可交易的认知资产

今天的 Agent 普遍面临“失忆症”:每次新会话都要重新建立上下文,学到的经验无法在不同 Agent 实例间共享。Hermes 从两个层面重塑了记忆体系,也由此指向了 Agent 操作系统最根本的演进方向:持久化、可检索、可迁移的统一认知空间

在短期层,Hermes 使用 SQLite FTS5 全文搜索引擎来构建本地记忆索引,而非依赖外部向量数据库。每一次交互的内容都会被序列化为结构化文件,FTS5 负责在后续任务中快速召回相关片段。同时,它通过 LLM 摘要机制对“过期”会话生成压缩概览,保证在上下文窗口有限的情况下仍然能保留关键信息。这种设计让记忆不再是“本轮对话的残影”,而成为 Agent 的文件系统级别的持久资源。

在长期层,Hermes 引入了 Honcho 这一辩证式用户建模组件。Honcho 会根据交互历史不断修正对用户偏好、思维习惯和决策模式的假设,逐步构建一个不断更新的“用户模型”。虽然该组件的实现仍在快速迭代中,但它代表了一个重要转变:Agent 不再只是被动检索记忆片段,而是主动形成关于用户的持久概念,并将这一模型用于后续所有跨会话的推理。

记忆方案 传统 Chat Agent Hermes 实践 演进方向(Agent OS)
短期存储 仅内存中的滑动窗口 FTS5 全文搜索 + 文件持久化 统一文件/对象存储,标准化接口
长期存储 无 / 外部数据库手动注入 LLM 摘要 + Honcho 用户建模 可跨 Agent 迁移的用户画像
知识复用 自动生成技能文档,存入共享库 社区技能市场,付费/积分交易
作者的结论 用完即弃 记忆开始基座化,但技能生态仍早期 认知资产可封装、可授权、可货币化

技能封存是记忆体系向“市场”延伸的自然结果。Hermes 每当成功完成一个复杂任务,就会自动生成一份结构化的技能文档,存入本地的 Skills 目录。其他 Hermes 实例(或者同一个 Agent 在日后)可以直接加载这份技能来复现整个工作流。当前社区已经在一个类似“应用商店”的雏形中共享技能,但从调研资料看,这还缺少统一的版本管理、可信验证和经济激励——而这三个要素,恰好是 Agent 操作系统下一步必须解决的基础设施问题。

核心维度二:自适应推理与边缘部署——模型无关性与休眠即忘的终结

如果 Agent 真的要像操作系统一样无处不在,它就必须摆脱对单一模型提供商的依赖,同时打破“必须绑定在个人电脑上才能持续运行”的物理约束。Hermes 在这两方面都给出了可操作的工程示范。

在模型抽象层,Hermes 实现了一条简单的 CLI 命令 hermes model 即可在 OpenAI、OpenRouter、Nous Portal、MiMo、GLM 等多家模型间热切换。底层逻辑是将推理调用封装为提供商无关的协议适配层,模型选择完全对应用逻辑透明。这对于 Agent 操作系统的意义在于:未来服务端 Agent 可以根据任务难度、成本、时延和隐私要求动态路由到不同模型,甚至在同一任务的不同阶段组合使用本地量化模型和云端大模型。

在部署后端上,Hermes 支持本地进程、Docker、SSH、Singularity、Modal 和 Daytona 六种模式。其中 Modal 和 Daytona 尤其值得注意:它们提供了一种“休眠-唤醒”机制——当 Agent 空闲时近乎零成本地停止计费,有请求进入时拉起实例并恢复记忆状态。这实现了“常驻而不常费”的运行形态,为 Agent 操作系统的去中心化持久运行扫清了成本障碍。

# 在 Hermes 中切换到本地量化模型(示例)
hermes model set nous-hermes-2:7b-q4_K_M
# Agent 将在本地 llama.cpp 后端运行,无需联网

面向边缘和离线场景的量化推理正在成为必选项。Hermes 尚未在核心代码中直接捆绑模型量化引擎,但其架构设计已将“推理后端”与“Agent 核心逻辑”彻底解耦。这意味着社区可以方便地接入 llama.cpp、MLC-LLM 等本地运行时。Agent 操作系统的下一步,必然是在安装包中内置量化模型管理服务,允许用户一键启用“飞行模式”,并自动完成推理任务的本地-云端拆分。

运行模式 典型传统 Agent Hermes 实践 未来 Agent OS 所必须具备的
模型绑定 强耦合单一 API 热切换,模型无关命令 动态模型路由,任务感知调度
在线要求 必须长连接 离线可用(本地模式) 本地优先,云端增强
部署弹性 单机常驻 休眠唤醒,6 种后端 跨节点迁移,边缘协同
成本模型 按 Token 付费 本地免费/云端按量 混合计费,基于任务 SLA
作者的结论 绑定就是风险 灵活但不自动优化 自主构建最优推理拓扑

核心维度三:安全与伦理框架的成熟——从临时审查到系统级治理

当 Agent 能够自主访问文件系统、执行远程命令、甚至代替用户发送消息时,安全问题就不再是“要不要加个审批按钮”的 UI 问题,而是操作系统级别的资源隔离与权限管理问题。

Hermes 目前的安全边界由三部分组成:命令审批机制(执行前需用户确认)、工具过滤器(可通过 MCP 协议限制外部服务的可调用范围)和容器化隔离(推荐在 Docker 或 Singularity 中运行)。这三层构成了一条从“人工介入”到“自动拒绝”的渐进式安全链。但其粗粒度仍然明显——缺乏基于意图的行为异常检测,也没有跨会话的安全审计日志标准。

调研资料中提到了一个尚未完全确认但方向明确的趋势:Hermes 社区正在讨论引入基于信用分级的自适应权限控制。具体而言,Agent 会依据某用户历史中的合规行为,动态调高其自动执行权限的阈值;而对于高风险操作,则回退到硬性安全边界。这种机制的底层思路很像操作系统中 sudo 的超时缓存或 smart-approval,但要求更丰富的上下文和持续性风险评估。

伦理审查同样被嵌入到 Hermes 的技能创建流程。每当 Agent 自动生成一个新的技能文档,都会附带一份“自我评估摘要”,描述该技能的输入、输出、潜在风险和使用限制。这些元数据如果能够标准化,未来就会成为技能市场中合规校验的数据基础。可以预见,一年内我们会看到类似技能安全等级标签(如 L0: 纯信息检索L1: 需确认的文件读写L2: 受限外部 API 调用)出现在开源 Agent 的生态中。

// 未来技能安全描述的可能范式(虚构,基于 Hermes 现有方向推演)
{
  "skill_name": "daily_report_generator",
  "security_level": "L1",
  "required_permissions": ["file_read", "local_write"],
  "risk_summary": "仅读取指定目录下的日志,产出本地报告。不涉及网络传输。",
  "last_security_review": "2026-06-10"
}

结论先行:Agent 操作系统不是一种产品,而是一套约定

如果要从 Hermes 的工程实践中提炼出一句话,那就是:Agent 操作系统的内核不是代码,而是对“自主进化、跨平台连续性、治理标准化”这三个原则的系统性承诺。 它不是某个公司发布的下一个框架版本,而是整个生态正在共同形成的技术与社会契约。

为了方便判断你目前所处的技术位置,下面用一张基于当前调研资料的对比表来概括传统 Agent、Hermes 以及未来的 Agent OS。

特征 传统 LLM Agent Hermes Agent(2026.02起) 演进中的 Agent OS
学习机制 无,或手动 Fine-tune 自动技能生成、周期性 Nudge 自进化集群,跨实例遗传算法
记忆体系 单会话滑动窗口 FTS5 + LLM 摘要 + Honcho 统一身份层,标准化认知存储协议
部署模型 云端 API 绑定 6 种后端,本地/休眠 边缘设备优先,任务驱动弹性伸缩
技能复用 社区共享 Skills 目录 开放技能市场,含支付与声誉系统
安全模型 仅命令审批 审批 + 工具过滤 + 容器 动态信用分权限、系统级审计、技能安全等级
跨平台存在 单平台 Bot 统一多通道网关 全平台持续在场,会话无缝迁移
作者的结论 工具阶段 从工具到平台的中途岛 下一代的认知基础设施

按场景推荐:你现在可以为演进做什么

无论你是一名独立开发者、技术负责人还是架构师,下面这些可操作的建议都基于 Hermes 已曝光的能力和当前调研资料中可确认的趋势,你可以立刻开始实践。

个人开发者 / 早期采用者

  • 立刻在本地部署一个 Hermes Agent,亲自跑通“任务→自动生成技能→下次复用”这个闭环,感受 FTS5 记忆检索和周期性 Nudge 的实际行为。
  • 尝试在 hermes model set 中切换到本地量化模型,体验离线推理与云端推理的能力边界,为后续的混合推理积累直觉。
  • 关注 Hermes 技能市场的标准化讨论,将自己的一两个常用工作流封装成技能,加入社区仓库。

中小技术团队

  • 在内部选择一个非关键业务场景,用 Hermes 的 cron 调度功能让 Agent 自主完成周期性任务(如日报生成、监控告警汇总),替代部分脚本。
  • 要求任何新引入的 Agent 框架必须提供多后端部署能力模型无关的抽象层,这两点将直接决定未来 3 个季度内的迁移成本。
  • 建立内部技能库,用 Git 管理 Skills 目录,为每一份技能文档添加安全风险描述——这比等待行业标准出现更实际。

企业架构决策者

  • 将“Agent 运行时”列为与容器运行时并列的基础设施能力,开始评估支持休眠唤醒、跨节点迁移的部署方案(例如 Daytona 或 Modal 模式)。
  • 在安全策略中补充 Agent 专用条款:要求所有 Agent 至少实现命令审批 + 工具过滤 + 资源隔离三层防护,并准备转换为基于信用分/行为反馈的动态权限模型。
  • 要求任何采购或引入的 Agent 产品支持记忆自主权的导出与迁移,避免被单一厂商的封闭记忆层锁定。

当你带着这些实践回到自己的技术栈中,会发现一个微妙的变化:你今天对 Agent 框架所做的每一次选型,其实都是在为未来的 Agent OS 投下信任票。而下一章,我们将从个体实践走向群体共创——深入 Hermes 的社区贡献体系,看看如何把你的技能、补丁和想法变成这个生态系统里真正运转的部件。

本文章首发在 LearnKu.com 网站上。

上一篇 下一篇
讨论数量: 0
发起讨论 只看当前版本


暂无话题~