Hermes Agent 和 Open WebUI 怎麼分工?我會把長任務 Agent Runtime 與團隊 AI 入口拆成兩層
如果你同時在看 Hermes Agent 和 Open WebUI,我認為最好的問題不是二選一,而是怎麼分層。Hermes Agent 比較適合做長任務與工具調用的執行層,Open WebUI 比較適合做團隊 AI 入口、知識工作區與權限治理層。真正有價值的做法,是把會做事的 agent 和能被安全使用的入口拆開。
Hermes Agent 和 Open WebUI 怎麼分工?我會把長任務 Agent Runtime 與團隊 AI 入口拆成兩層
如果你最近同時在看 Hermes Agent 和 Open WebUI,很容易先冒出一個問題:這兩個到底是不是同一類工具?一個看起來像 agent runtime,一個看起來像聊天介面,但它們又都支援多模型、工具、權限和實際工作流,所以很多人最後會卡在一句很模糊的判斷上: 到底該選哪一個?
我自己的結論是,Hermes Agent 和 Open WebUI 最好的用法,不是二選一,而是分層使用。 截至 2026 年 5 月 3 日,Hermes Agent 在 GitHub 約有 13.1 萬 stars,最新 release 是 v0.12.0,發布於 2026 年 4 月 30 日;Open WebUI 在 GitHub 約有 13.2 萬 stars,最新 release 是 v0.9.2,發布於 2026 年 4 月 24 日。兩邊都很熱門,但它們真正解的不是同一個問題。
如果我只用一句話分工,我會這樣說:
- Hermes Agent:比較像會長期運作、能記憶、能調工具、能跨入口工作的 agent runtime
- Open WebUI:比較像團隊共用的 AI 入口、治理層與操作介面
也就是說,Hermes Agent 比較接近「後台真的去做事的 agent」,Open WebUI 比較接近「讓人安全地叫 agent 做事、管理模型、整理知識與控管權限的前台」。這篇我想回答的,不只是兩者差在哪裡,而是更實際的三件事:
- 兩者各自的好處到底是什麼
- 放在一起時最合理的架構是什麼
- 實際要怎麼開始接起來
如果你還沒看過我前面那兩篇單篇文章,可以先補這兩篇背景:
先講結論:Hermes Agent 是執行層,Open WebUI 是入口與治理層
我認為很多人會把這兩個工具看混,核心原因在於它們都碰到了「多模型」「工具呼叫」「團隊使用」「工作流程」這些詞,但所在層級不同。
Hermes Agent 的主體是一個 agent runtime。它的官方文件強調的是:
- 持續存在的 session
- memory 和 user profile
- skill system
- messaging gateway
- tool gateway
- terminal、檔案操作、web search 與排程能力
換句話說,它想解的是:「agent 怎麼真的工作,而且可以持續工作。」
Open WebUI 則是另外一條路。它的官方文件從一開始就把自己定義成 one interface for every AI model,而且強調:
- 多模型入口
- knowledge 與 RAG
- Tools、Functions、Pipelines、MCP、OpenAPI extensibility
- RBAC、Groups、Permissions
- 多使用者協作
- Open Terminal 與可接外部 agent
換句話說,它想解的是:「人和團隊怎麼以可管理、可共用、可控權的方式使用 AI。」
所以如果你問我兩邊怎麼分工,我的答案不是「哪個比較強」,而是:
- Hermes Agent 幫你把 AI 做成可持續執行的工作者
- Open WebUI 幫你把這個工作者變成大家能安全使用的入口
Hermes Agent 的好處,不是會聊天,而是真的能長時間做事
Hermes Agent 最有價值的地方,我認為不在 CLI 外觀,而在它把很多 agent 長期運作才會遇到的問題一起放進核心設計。
例如在官方 README 和文件裡,你會看到它不只談模型,還談:
- Skills system
- Persistent memory
- Messaging gateway
- MCP integration
- Cron scheduling
- Security 與 container isolation
這些東西放在一起的意思其實很明確:Hermes Agent 不是要做一次性的 prompt 執行器,而是要做一個可以被長期委派工作的 agent runtime。
這個差異很重要。因為很多團隊真正卡住的,不是模型不夠聰明,而是 agent 很難跨 session 保留狀態、很難被不同入口喚起、很難在長任務裡持續追蹤工具輸出,也很難把做過的工作方式沉澱下來。Hermes Agent 至少是直接對著這些問題設計。
所以如果你的需求比較像下面幾種,Hermes Agent 的價值會很清楚:
- 你要一個能持續跑任務、而不是只回一輪答案的 agent
- 你希望它有自己的 skills、memory 和 tool routing
- 你之後可能會從 Telegram、Slack、Discord 或 API 去喚起它
- 你不希望 agent 能力只綁在某一個 IDE 或某一個聊天窗
Open WebUI 的好處,不只是介面好看,而是它把治理層做進來了
Open WebUI 常常被低估成「自架版 ChatGPT 頁面」,但我實際看官方文件後,認為它比較接近一個可自架的 AI operating surface。
它有幾個地方特別實用。
第一個是多模型與多能力入口整合。官方文件明講,Open WebUI 可以把對話、知識、工具、模型都放在同一個工作介面,而且能透過 Python tools、Pipelines、MCP 和 OpenAPI 加能力。這代表它不是只能接單一 provider 的聊天框。
第二個是知識與工作區管理。你可以把文件、knowledge base、prompts、tools 放進同一個多使用者環境,而不是讓每個人各自維護一套 prompt、自己記一份連線設定。
第三個是權限與群組控制。Open WebUI 官方 RBAC 文件很清楚,權限模型由 Roles、Permissions、Groups 組成,而且權限是 additive 的。這代表它很適合做團隊內部 AI 平台,因為你可以明確管理:
- 哪些人能用哪些模型
- 哪些人能碰 knowledge bases
- 哪些群組能用 image generation 或 file upload
- 哪些資源只對特定群組開放
這種能力對個人使用者未必有感,但對團隊導入很重要。很多 AI 工具的真正成本,不是模型費,而是治理失控後的維護成本。
兩個一起用時,真正的好處是把「會做事」和「能被安全使用」拆開
這也是我最推薦的做法。
Hermes Agent 很適合做執行層,因為它擅長工具調用、長任務、技能、記憶與持續運作。
Open WebUI 很適合做入口層,因為它擅長多模型整合、知識工作區、權限控管與多人使用。
把這兩層拆開之後,你會得到幾個非常實際的好處:
1. 前後台責任比較清楚
Open WebUI 負責:
- 使用者登入
- 模型清單與連線管理
- 權限與群組
- 知識庫與工作區管理
- 給使用者一個一致的操作介面
Hermes Agent 負責:
- 真正接收請求
- 決定何時調工具
- 執行 terminal / file / search / memory / skills
- 持續跑長任務
2. 團隊不必每個人都直接碰 Hermes CLI
如果 Hermes Agent 單獨用,很多情況下代表每個人都要理解 runtime、provider、gateway、session 與安全邊界。這對少數 power user 很合理,但不一定適合整個團隊。
Open WebUI 的價值,就是讓團隊裡不需要每個人都直接進 runtime 層,也能透過一致介面使用 agent。
3. 權限與入口可以先治理,再逐步開放 agent 能力
我很喜歡 Open WebUI 官方 RBAC 文件反覆強調的一點:權限是 additive,而且最佳實踐是先從最小權限開始。這種設計很適合拿來包裝 Hermes Agent,因為你不一定要一開始就把所有工具都開給所有人。
你可以先開一小群人:
- 能用 Hermes Agent 模型
- 能存取特定 knowledge
- 能用某些工具
- 能做試點工作流
等 pilot 順了,再擴大。
實作上怎麼接?官方其實已經給了一條很短的路
這次我覺得最實用的發現是:Open WebUI 官方文件本身就有一頁專門寫「怎麼把 Hermes Agent 接進 Open WebUI」。
它的整體邏輯很簡單:
- 先把 Hermes Agent 裝好
- 在 Hermes 端開啟 OpenAI-compatible API server
- 跑
hermes gateway - 在 Open WebUI 的 OpenAI connection 裡把 Hermes 接進來
也就是說,Open WebUI 並不是把 Hermes 當 plugin,而是把 Hermes 當一個 OpenAI-compatible 後端 agent 來接。
這個做法很漂亮,因為兩邊責任很乾淨:
- Hermes Agent 專心當 agent backend
- Open WebUI 專心當人機互動與治理層
如何開始使用?我建議先做這 4 步
如果你想驗證這組合值不值得導入,我建議先不要一開始就碰最複雜的權限與多環境佈署,而是先做一條最小可驗證路徑。
第一步:先把 Open WebUI 跑起來,確認它是你的團隊入口
Open WebUI 官方 getting started 推薦的最快路徑是 Docker。最短命令是:
docker run -d -p 3000:8080 \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:main這一步不要急著追求最完整功能,你先確認兩件事就好:
- 團隊成員可以打開同一個入口
- 你有能力管理連線、模型與工作區
第二步:把 Hermes Agent 裝好,先確認它自己能正常工作
這一步先按照 Hermes Agent 官方 quickstart 跑,確認:
hermes --version以及你已經能正常開啟本地 session、切 provider、跑基本工具。這一步的目的很單純:先分開驗證 Hermes runtime 本身沒問題,不要一開始就把錯誤全丟到整合層。
如果你想先理解 Hermes 本身在設計上解什麼問題,可以回看我前面那篇單篇分析:
第三步:在 Hermes 端打開 API server,讓 Open WebUI 把它當模型後端接進來
Open WebUI 官方 Hermes 整合頁建議在 ~/.hermes/.env 設定:
API_SERVER_ENABLED=true
API_SERVER_KEY=your-secret-key預設情況下,Hermes API server 會綁在:
- Host:
127.0.0.1 - Port:
8642
接著啟動:
hermes gateway看到 API server listening 後,再去 Open WebUI 後台新增 OpenAI 連線,填:
- URL:
http://localhost:8642/v1 - API Key: 你剛剛設的
API_SERVER_KEY
如果 Open WebUI 自己跑在 Docker 裡,官方文件也提醒要把 localhost 換成:
http://host.docker.internal:8642/v1這一步的第一個可驗證任務,不是叫它做很難的專案,而是確認:
- Open WebUI 能看到
hermes-agent這個 model - 送出訊息後,能看到 Hermes 的工具執行流與回應
第四步:先用一個明確的長任務試點,不要先做全員導入
我會建議第一個試點選這種任務:
- 讀一個 repo 後整理下一步工作清單
- 跑一段 terminal / file / search 組合任務
- 根據已有知識庫回答較長流程問題
- 幫某個內部操作流程建立可重用 skill
不要一開始就要求它處理全公司最關鍵的流程。比較好的做法是先測:
- 它在 Open WebUI 裡是否真的比單純聊天模型更能做事
- 哪些工具該開給哪些群組
- 哪些回應適合透過 UI 使用,哪些還是保留給 power user 走 CLI
我會怎麼分配兩邊的使用場景?
如果你要我給最簡單的導入判斷,我會這樣分。
優先把 Open WebUI 當主入口
適合這些情境:
- 你有多人要共用 AI 入口
- 你在意權限、群組、知識庫與可管理性
- 你想整合多個模型,而不是只押單一 agent
- 你需要一個比較穩定的團隊操作介面
優先把 Hermes Agent 當深度執行層
適合這些情境:
- 你要的不是聊天,而是持續執行
- 你需要 skill、memory、gateway、terminal、排程
- 你想把 agent 放進更長的工作循環
- 你願意投資在 runtime 與 agent 操作邏輯上
兩個一起用最適合的情境
- 你想做團隊內部 AI 平台,但不只想做問答
- 你希望前台是易用的 Web 入口,後台是可長期運作的 agent
- 你需要一邊控權、一邊讓 agent 真正執行多步任務
限制與風險也要先講清楚
這種組合很實用,但不是零成本。
第一個限制是維運邊界變多了。
你不再只維護一個聊天頁,而是至少有:
- Open WebUI
- Hermes Agent runtime
- model provider 連線
- knowledge / tools / gateway 設定
第二個限制是治理不能只靠 UI。
Open WebUI 的 RBAC 能控的是平台內權限,但官方文件也明講,這不等於 provider 側的 least privilege。也就是說,Hermes 能碰到什麼工具、背後 API key 有多大權限,還是要另外設計。
第三個限制是不是每個人都需要 Hermes 這麼重的執行層。
如果你的團隊主要需求只是:
- 多模型聊天
- 文件查詢
- 基礎知識庫
那 Open WebUI 單獨用就可能已經夠了。不是每個團隊都一定需要把 agent runtime 拉進來。
誰適合先試?
我認為下面三種團隊特別適合先做這種分層導入:
- 想自建團隊 AI portal,但不想只停在問答層的技術團隊
- 已經在試 agent automation,卻缺少多人可共用入口與權限治理的組織
- 想把 power user 的 agent 能力,逐步包裝成整個團隊能使用的內部平台
反過來說,如果你現在還在非常早期,只是想測模型聊天體驗或做個人使用,那先單獨用 Open WebUI 或單獨用 Hermes Agent 都可能比較輕。
結語
我現在看 Hermes Agent 和 Open WebUI,最關鍵的不是它們有沒有功能重疊,而是它們剛好把同一條導入路徑切成兩層。
Hermes Agent 處理的是「怎麼讓 agent 真正去工作」。
Open WebUI 處理的是「怎麼讓人和團隊安全、穩定地使用這個 agent」。
如果你只需要其中一層,選單一工具就夠。
但如果你同時想要「能做事的 agent」和「可管理的團隊入口」,那把 Hermes Agent 放在後台、把 Open WebUI 放在前台,是我目前看到最合理、也最容易從小規模 pilot 開始的組合之一。
參考資料
- AI Chain:5 個關鍵設計 + 4 個上手步驟:我怎麼看 Hermes Agent 不只是另一個 CLI Agent
- Hermes Agent GitHub Repository
- Hermes Agent 官方文件首頁
- Hermes Agent AI Providers
- Hermes Agent Tool Gateway
- Open WebUI GitHub Repository
- Open WebUI Getting Started
- Open WebUI Quick Start
- Open WebUI Features
- Open WebUI RBAC Overview
- Open WebUI Permissions
- Open WebUI Groups
- Open WebUI 連接 Hermes Agent 官方教學