这两天我重新翻了一遍 agency-agents-zh 这个仓库。

本来只是想看看它那套角色库到底值不值得抄作业,结果越看越觉得,很多人把 Hermes 用不顺,不是因为模型不够强,也不是工具没接全,而是更前面那一步就没写明白。

你到底想让它成为什么样的人。

还有,它到底在你这里扮演什么角色。

这两个问题不写清楚,Hermes 就很容易变得很怪。

今天像助理,明天像搜索框,后天又像客服机器人。你让它写东西,它会漂;你让它帮你做判断,它会虚;你让它长期陪跑,它又经常像刚入职。

说实话,很多人不是在用 Agent,而是在反复重新驯化同一个 Agent。

而这个仓库,刚好把问题点破了。

真正值钱的,不是 211 个角色,而是它把角色写实了

agency-agents-zh 的体量当然很大。

README 里写得很直接:211 个 AI 专家角色,18 个部门,支持 16 种 AI 工具。这个数字第一眼看过去,确实挺唬人。

但我看完以后,真正记住的不是“角色很多”。

而是它终于把“角色”这件事写得不像一句空话了。

普通提示词很喜欢一句带过:你现在是一位某某专家。

这种写法的问题是,身份有了,做法没有;语气有了,标准没有;看起来像专家,真干活时还是容易飘。

这个仓库不一样。

README 说得很清楚,这不是普通提示词模板,而是一套把身份定义、关键规则、工作流程、可交付物都写进去的角色库。

这就一下子从“扮演”走到了“履职”。

差别挺大。

我专门看了那个公众号运营角色,写法很有代表性

你这次让我参考 marketing-wechat-operator.md,我专门把它完整读了一遍。

它最有意思的地方,不是它在教你怎么做公众号,而是它把一个角色该怎么成立,写得非常完整。

它里面不是只有一个职业名。

而是把几层东西都分开了:

  • 你是谁
  • 你的个性是什么
  • 你记住什么类型的经验
  • 你的核心使命是什么
  • 你的工作流程怎么走
  • 你的关键规则是什么
  • 你最后该交付什么东西

你看,这才像一个能长期上岗的角色。

而不是一个临时被叫来救场的提示词。

我觉得很多人调 Hermes 时,最容易忽略的也正是这里。

他们给了工具,给了模型,给了权限,甚至给了自动化流程。

唯独没认真回答:这个 Agent 平时怎么说话,遇事怎么判断,接到任务以后按什么顺序做,什么能做,什么不能做,最后要交出什么样的结果。

不补这层,后面很难稳。

人格管“相处感”,角色管“干活方式”

这两个词经常被混着用。

但在我看来,它们根本不是一回事。

人格,解决的是你愿不愿意长期和它相处。

角色,解决的是你敢不敢把任务持续交给它。

人格更像底色。

比如它该克制一点,还是活泼一点;该像搭档,还是像执行助理;遇到外部发送动作时,是不是应该天然更谨慎;它该不该有一点固定脾气和边界感。

这些东西会决定 Hermes 有没有“人味”。

角色更像岗位说明书。

比如它是写作助手、资料检索员、代码审查员、公众号编辑,还是 Obsidian 整理员。每种角色都应该有自己的流程、标准、禁区和交付格式。

这些东西会决定 Hermes 有没有“岗位感”。

少了人格,它就容易像个没有稳定气质的工具壳子。

少了角色,它就容易会聊不会干,或者一到具体任务就开始乱切频道。

所以我越来越觉得,Hermes 真想好用,别把这两层揉成一坨。

人格单独写。

角色单独写。

然后再让它们配合起来。

这套分层思路,和 Hermes 本身也很搭

README 里有一个细节我挺喜欢。

它在 OpenClaw 那条线上,会把一个智能体拆成 SOUL.mdAGENTS.mdIDENTITY.md 三部分。

这个设计本身就在提醒你:

一个 Agent 像不像人,和它会不会做事,本来就应该分层定义。

而到了 Hermes 这边,README 也写得很明确:这些角色会转换成分类目录下的 SKILL.md,然后安装到 ~/.hermes/skills/ 里,通过 hermes skills 去管理。

这就很适合拿来给 Hermes 搭骨架。

我的理解很简单。

长期不变的东西,放在人格层。

比如 SOUL、USER、MEMORY 这一类长期上下文里,写它的说话方式、做事边界、对你的理解、对外部动作的谨慎程度、以及你希望它保持的气质。

高频切换的东西,放在角色层。

比如 skills 里分门别类去写:写作、研究、开发、整理、审查、运营。每一个角色都只负责一类事,把流程和交付写清楚。

这样一来,Hermes 的体验会稳很多。

它不会一会儿像朋友,一会儿像外包,一会儿又像没培训完的实习生。

为什么很多人的 Hermes 越配越累

这个问题我最近感受特别深。

有些配置,表面上非常豪华。

模型一堆,工具一堆,MCP 接了一排,自动化也拉满了。

结果真用起来还是累。

累在哪?

累在它每次都像重新认识你。

你想让它保持固定语气,它会漂。

你想让它用固定套路处理某类任务,它会变。

你今天刚教会它怎么写,明天它又给你换一套表达。

你把它当长期搭档,它却总像一个状态不稳定的临时工。

这类问题,很多时候跟模型强不强没那么大关系。

反倒和你前面有没有把人格、角色、规则、流程写透,关系更大。

仓库里的 211 个角色,在我看来最值钱的地方,也不是“多”,而是它提醒你:

Agent 的稳定,往往不是靠你一次次现场提醒。

而是靠你提前把岗位说明书写完整。

如果你现在要给 Hermes 重新立人设,我更建议这么做

我自己会分成 4 步。

1、先写人格,先别急着堆技能

先想清楚你到底想和一个什么样的 Hermes 相处。

它说话是克制一点,还是松一点? 它该不该有固定口吻? 它遇到外发操作时要不要更保守? 它更像搭档、编辑、研究助手,还是偏执行型助理?

这些看起来不“技术”,但其实特别关键。

因为它决定的是手感。

手感不对,后面你技能装得越多,违和感反而越强。

2、再写角色,而且一个角色只做一类事

别上来就整一个“全能专家”。

这种最容易失焦。

写作就是写作。 检索就是检索。 代码审查就是代码审查。 公众号运营就是公众号运营。

一个角色只负责一类任务,边界越清楚,输出越稳,后期维护也越省心。

这点 marketing-wechat-operator.md 其实就给了很典型的示范。

它不是泛泛地说“帮你做微信内容”。

而是把公众号内容、社群运营、裂变增长、合规边界、工作流程,全都放在同一个专业岗位框架里。

这才叫角色闭环。

3、给每个角色补上流程、红线和交付物

这是最容易被偷懒的一步。

很多人只写一句“你是某某专家”,然后就希望 Agent 自动发挥。

但真正决定质量上限的,往往不是头衔,而是后面的流程和红线。

比如:

  • 资料型角色要先查再写
  • 教程型角色要写前置条件、具体命令、预期结果和排错
  • 外发型角色要先确认范围
  • 公众号型角色要有判断,要像真人,不要写成说明文
  • 代码审查型角色要有固定检查顺序和风险优先级

规则越具体,返工越少。

4、最后按分类装进 Hermes,长期维护

README 里提到,Hermes 这边会把角色转成 SKILL.md 放到 ~/.hermes/skills/

这个思路我很认同。

你后面更新、删改、补规则都方便。

写作一组。 研究一组。 开发一组。 运营一组。

时间久了,你不是在堆提示词,而是在养一个可维护的角色系统。

这两件事差很多。

前者越堆越乱。

后者会越用越顺。

真正好用的 Hermes,得同时有“人味”和“岗位感”

我现在看一个 Agent 是否值得长期养,有个标准越来越明确。

只会聊天,不够。

只会执行,也不够。

真正顺手的状态,是它既像一个你愿意长期说话的对象,也像一个知道自己职责边界的岗位。

人格决定你愿不愿意把它留在身边。

角色决定你敢不敢把任务真的交给它。

这两个东西一旦写清楚,Hermes 的手感会完全不一样。

你会明显感觉到,它不再只是“调用模型的一个壳”。

它开始更像一个熟悉你、也清楚自己职责的助手。

到这个阶段,模型、工具链、自动化,才会真正开始加分。

不然的话,配得再满,也只是一个功能很多但性格飘忽、工作方式不稳定的半成品。

所以如果你最近也在折腾 Hermes,我的建议很直接。

先别急着继续加东西。

先把它写清楚。

先给它一个稳定的人格。

再给它几个真正能上岗的角色。

这一步做对了,后面的 Hermes,才更像主力助手,而不是下一轮等待你重新调教的玩具。