AI-Chain

Hermes Agent 和 Open WebUI 怎麼分工?我會把長任務 Agent Runtime 與團隊 AI 入口拆成兩層

如果你同時在看 Hermes Agent 和 Open WebUI,我認為最好的問題不是二選一,而是怎麼分層。Hermes Agent 比較適合做長任務與工具調用的執行層,Open WebUI 比較適合做團隊 AI 入口、知識工作區與權限治理層。真正有價值的做法,是把會做事的 agent 和能被安全使用的入口拆開。

分享:
Hermes Agent 和 Open WebUI 怎麼分工?我會把長任務 Agent Runtime 與團隊 AI 入口拆成兩層

Hermes Agent 和 Open WebUI 怎麼分工?我會把長任務 Agent Runtime 與團隊 AI 入口拆成兩層

如果你最近同時在看 Hermes Agent 和 Open WebUI,很容易先冒出一個問題:這兩個到底是不是同一類工具?一個看起來像 agent runtime,一個看起來像聊天介面,但它們又都支援多模型、工具、權限和實際工作流,所以很多人最後會卡在一句很模糊的判斷上: 到底該選哪一個?

我自己的結論是,Hermes Agent 和 Open WebUI 最好的用法,不是二選一,而是分層使用。 截至 2026 年 5 月 3 日,Hermes Agent 在 GitHub 約有 13.1 萬 stars,最新 release 是 v0.12.0,發布於 2026 年 4 月 30 日;Open WebUI 在 GitHub 約有 13.2 萬 stars,最新 release 是 v0.9.2,發布於 2026 年 4 月 24 日。兩邊都很熱門,但它們真正解的不是同一個問題。

如果我只用一句話分工,我會這樣說:

  • Hermes Agent:比較像會長期運作、能記憶、能調工具、能跨入口工作的 agent runtime
  • Open WebUI:比較像團隊共用的 AI 入口、治理層與操作介面

也就是說,Hermes Agent 比較接近「後台真的去做事的 agent」,Open WebUI 比較接近「讓人安全地叫 agent 做事、管理模型、整理知識與控管權限的前台」。這篇我想回答的,不只是兩者差在哪裡,而是更實際的三件事:

  1. 兩者各自的好處到底是什麼
  2. 放在一起時最合理的架構是什麼
  3. 實際要怎麼開始接起來

如果你還沒看過我前面那兩篇單篇文章,可以先補這兩篇背景:

先講結論:Hermes Agent 是執行層,Open WebUI 是入口與治理層

我認為很多人會把這兩個工具看混,核心原因在於它們都碰到了「多模型」「工具呼叫」「團隊使用」「工作流程」這些詞,但所在層級不同。

Hermes Agent 的主體是一個 agent runtime。它的官方文件強調的是:

  • 持續存在的 session
  • memory 和 user profile
  • skill system
  • messaging gateway
  • tool gateway
  • terminal、檔案操作、web search 與排程能力

換句話說,它想解的是:「agent 怎麼真的工作,而且可以持續工作。」

Open WebUI 則是另外一條路。它的官方文件從一開始就把自己定義成 one interface for every AI model,而且強調:

  • 多模型入口
  • knowledge 與 RAG
  • Tools、Functions、Pipelines、MCP、OpenAPI extensibility
  • RBAC、Groups、Permissions
  • 多使用者協作
  • Open Terminal 與可接外部 agent

換句話說,它想解的是:「人和團隊怎麼以可管理、可共用、可控權的方式使用 AI。」

所以如果你問我兩邊怎麼分工,我的答案不是「哪個比較強」,而是:

  • Hermes Agent 幫你把 AI 做成可持續執行的工作者
  • Open WebUI 幫你把這個工作者變成大家能安全使用的入口

Hermes Agent 的好處,不是會聊天,而是真的能長時間做事

Hermes Agent 最有價值的地方,我認為不在 CLI 外觀,而在它把很多 agent 長期運作才會遇到的問題一起放進核心設計。

例如在官方 README 和文件裡,你會看到它不只談模型,還談:

  • Skills system
  • Persistent memory
  • Messaging gateway
  • MCP integration
  • Cron scheduling
  • Security 與 container isolation

這些東西放在一起的意思其實很明確:Hermes Agent 不是要做一次性的 prompt 執行器,而是要做一個可以被長期委派工作的 agent runtime。

這個差異很重要。因為很多團隊真正卡住的,不是模型不夠聰明,而是 agent 很難跨 session 保留狀態、很難被不同入口喚起、很難在長任務裡持續追蹤工具輸出,也很難把做過的工作方式沉澱下來。Hermes Agent 至少是直接對著這些問題設計。

所以如果你的需求比較像下面幾種,Hermes Agent 的價值會很清楚:

  • 你要一個能持續跑任務、而不是只回一輪答案的 agent
  • 你希望它有自己的 skills、memory 和 tool routing
  • 你之後可能會從 Telegram、Slack、Discord 或 API 去喚起它
  • 你不希望 agent 能力只綁在某一個 IDE 或某一個聊天窗

Open WebUI 的好處,不只是介面好看,而是它把治理層做進來了

Open WebUI 常常被低估成「自架版 ChatGPT 頁面」,但我實際看官方文件後,認為它比較接近一個可自架的 AI operating surface。

它有幾個地方特別實用。

第一個是多模型與多能力入口整合。官方文件明講,Open WebUI 可以把對話、知識、工具、模型都放在同一個工作介面,而且能透過 Python tools、Pipelines、MCP 和 OpenAPI 加能力。這代表它不是只能接單一 provider 的聊天框。

第二個是知識與工作區管理。你可以把文件、knowledge base、prompts、tools 放進同一個多使用者環境,而不是讓每個人各自維護一套 prompt、自己記一份連線設定。

第三個是權限與群組控制。Open WebUI 官方 RBAC 文件很清楚,權限模型由 Roles、Permissions、Groups 組成,而且權限是 additive 的。這代表它很適合做團隊內部 AI 平台,因為你可以明確管理:

  • 哪些人能用哪些模型
  • 哪些人能碰 knowledge bases
  • 哪些群組能用 image generation 或 file upload
  • 哪些資源只對特定群組開放

這種能力對個人使用者未必有感,但對團隊導入很重要。很多 AI 工具的真正成本,不是模型費,而是治理失控後的維護成本。

兩個一起用時,真正的好處是把「會做事」和「能被安全使用」拆開

這也是我最推薦的做法。

Hermes Agent 很適合做執行層,因為它擅長工具調用、長任務、技能、記憶與持續運作。

Open WebUI 很適合做入口層,因為它擅長多模型整合、知識工作區、權限控管與多人使用。

把這兩層拆開之後,你會得到幾個非常實際的好處:

1. 前後台責任比較清楚

Open WebUI 負責:

  • 使用者登入
  • 模型清單與連線管理
  • 權限與群組
  • 知識庫與工作區管理
  • 給使用者一個一致的操作介面

Hermes Agent 負責:

  • 真正接收請求
  • 決定何時調工具
  • 執行 terminal / file / search / memory / skills
  • 持續跑長任務

2. 團隊不必每個人都直接碰 Hermes CLI

如果 Hermes Agent 單獨用,很多情況下代表每個人都要理解 runtime、provider、gateway、session 與安全邊界。這對少數 power user 很合理,但不一定適合整個團隊。

Open WebUI 的價值,就是讓團隊裡不需要每個人都直接進 runtime 層,也能透過一致介面使用 agent。

3. 權限與入口可以先治理,再逐步開放 agent 能力

我很喜歡 Open WebUI 官方 RBAC 文件反覆強調的一點:權限是 additive,而且最佳實踐是先從最小權限開始。這種設計很適合拿來包裝 Hermes Agent,因為你不一定要一開始就把所有工具都開給所有人。

你可以先開一小群人:

  • 能用 Hermes Agent 模型
  • 能存取特定 knowledge
  • 能用某些工具
  • 能做試點工作流

等 pilot 順了,再擴大。

實作上怎麼接?官方其實已經給了一條很短的路

這次我覺得最實用的發現是:Open WebUI 官方文件本身就有一頁專門寫「怎麼把 Hermes Agent 接進 Open WebUI」。

它的整體邏輯很簡單:

  1. 先把 Hermes Agent 裝好
  2. 在 Hermes 端開啟 OpenAI-compatible API server
  3. hermes gateway
  4. 在 Open WebUI 的 OpenAI connection 裡把 Hermes 接進來

也就是說,Open WebUI 並不是把 Hermes 當 plugin,而是把 Hermes 當一個 OpenAI-compatible 後端 agent 來接。

這個做法很漂亮,因為兩邊責任很乾淨:

  • Hermes Agent 專心當 agent backend
  • Open WebUI 專心當人機互動與治理層

如何開始使用?我建議先做這 4 步

如果你想驗證這組合值不值得導入,我建議先不要一開始就碰最複雜的權限與多環境佈署,而是先做一條最小可驗證路徑。

第一步:先把 Open WebUI 跑起來,確認它是你的團隊入口

Open WebUI 官方 getting started 推薦的最快路徑是 Docker。最短命令是:

docker run -d -p 3000:8080 \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

這一步不要急著追求最完整功能,你先確認兩件事就好:

  • 團隊成員可以打開同一個入口
  • 你有能力管理連線、模型與工作區

第二步:把 Hermes Agent 裝好,先確認它自己能正常工作

這一步先按照 Hermes Agent 官方 quickstart 跑,確認:

hermes --version

以及你已經能正常開啟本地 session、切 provider、跑基本工具。這一步的目的很單純:先分開驗證 Hermes runtime 本身沒問題,不要一開始就把錯誤全丟到整合層。

如果你想先理解 Hermes 本身在設計上解什麼問題,可以回看我前面那篇單篇分析:

第三步:在 Hermes 端打開 API server,讓 Open WebUI 把它當模型後端接進來

Open WebUI 官方 Hermes 整合頁建議在 ~/.hermes/.env 設定:

API_SERVER_ENABLED=true
API_SERVER_KEY=your-secret-key

預設情況下,Hermes API server 會綁在:

  • Host: 127.0.0.1
  • Port: 8642

接著啟動:

hermes gateway

看到 API server listening 後,再去 Open WebUI 後台新增 OpenAI 連線,填:

  • URL: http://localhost:8642/v1
  • API Key: 你剛剛設的 API_SERVER_KEY

如果 Open WebUI 自己跑在 Docker 裡,官方文件也提醒要把 localhost 換成:

http://host.docker.internal:8642/v1

這一步的第一個可驗證任務,不是叫它做很難的專案,而是確認:

  • Open WebUI 能看到 hermes-agent 這個 model
  • 送出訊息後,能看到 Hermes 的工具執行流與回應

第四步:先用一個明確的長任務試點,不要先做全員導入

我會建議第一個試點選這種任務:

  • 讀一個 repo 後整理下一步工作清單
  • 跑一段 terminal / file / search 組合任務
  • 根據已有知識庫回答較長流程問題
  • 幫某個內部操作流程建立可重用 skill

不要一開始就要求它處理全公司最關鍵的流程。比較好的做法是先測:

  • 它在 Open WebUI 裡是否真的比單純聊天模型更能做事
  • 哪些工具該開給哪些群組
  • 哪些回應適合透過 UI 使用,哪些還是保留給 power user 走 CLI

我會怎麼分配兩邊的使用場景?

如果你要我給最簡單的導入判斷,我會這樣分。

優先把 Open WebUI 當主入口

適合這些情境:

  • 你有多人要共用 AI 入口
  • 你在意權限、群組、知識庫與可管理性
  • 你想整合多個模型,而不是只押單一 agent
  • 你需要一個比較穩定的團隊操作介面

優先把 Hermes Agent 當深度執行層

適合這些情境:

  • 你要的不是聊天,而是持續執行
  • 你需要 skill、memory、gateway、terminal、排程
  • 你想把 agent 放進更長的工作循環
  • 你願意投資在 runtime 與 agent 操作邏輯上

兩個一起用最適合的情境

  • 你想做團隊內部 AI 平台,但不只想做問答
  • 你希望前台是易用的 Web 入口,後台是可長期運作的 agent
  • 你需要一邊控權、一邊讓 agent 真正執行多步任務

限制與風險也要先講清楚

這種組合很實用,但不是零成本。

第一個限制是維運邊界變多了

你不再只維護一個聊天頁,而是至少有:

  • Open WebUI
  • Hermes Agent runtime
  • model provider 連線
  • knowledge / tools / gateway 設定

第二個限制是治理不能只靠 UI

Open WebUI 的 RBAC 能控的是平台內權限,但官方文件也明講,這不等於 provider 側的 least privilege。也就是說,Hermes 能碰到什麼工具、背後 API key 有多大權限,還是要另外設計。

第三個限制是不是每個人都需要 Hermes 這麼重的執行層

如果你的團隊主要需求只是:

  • 多模型聊天
  • 文件查詢
  • 基礎知識庫

那 Open WebUI 單獨用就可能已經夠了。不是每個團隊都一定需要把 agent runtime 拉進來。

誰適合先試?

我認為下面三種團隊特別適合先做這種分層導入:

  • 想自建團隊 AI portal,但不想只停在問答層的技術團隊
  • 已經在試 agent automation,卻缺少多人可共用入口與權限治理的組織
  • 想把 power user 的 agent 能力,逐步包裝成整個團隊能使用的內部平台

反過來說,如果你現在還在非常早期,只是想測模型聊天體驗或做個人使用,那先單獨用 Open WebUI 或單獨用 Hermes Agent 都可能比較輕。

結語

我現在看 Hermes Agent 和 Open WebUI,最關鍵的不是它們有沒有功能重疊,而是它們剛好把同一條導入路徑切成兩層。

Hermes Agent 處理的是「怎麼讓 agent 真正去工作」。

Open WebUI 處理的是「怎麼讓人和團隊安全、穩定地使用這個 agent」。

如果你只需要其中一層,選單一工具就夠。

但如果你同時想要「能做事的 agent」和「可管理的團隊入口」,那把 Hermes Agent 放在後台、把 Open WebUI 放在前台,是我目前看到最合理、也最容易從小規模 pilot 開始的組合之一。

參考資料