AI-Chain
LLM

LLM

共 12 篇文章

Lucebox-Hub:當 AI 遇見硬體,手動最佳化如何釋放 LLM 潛力?

Lucebox-Hub:當 AI 遇見硬體,手動最佳化如何釋放 LLM 潛力?

Lucebox-Hub 專案透過手動重寫 LLM 推理軟體,為 NVIDIA RTX 3090 等消費級硬體量身打造最佳化方案。它挑戰雲端 AI 模式,透過 Megakernel、DFlash、PFlash 大幅提升本地 LLM 效能、降低功耗,實現私有、高效、無需付費的普惠 AI。這篇深入探討其核心技術與未來展望,為本地 AI 部署提供新範式。
閱讀更多
2 條知識圖譜路線 + 4 個選型問題:Graphify 與 Andrej Karpathy LLM Wiki,我會怎麼選

2 條知識圖譜路線 + 4 個選型問題:Graphify 與 Andrej Karpathy LLM Wiki,我會怎麼選

如果你最近也在研究怎麼把文件、論文、筆記與程式碼變成可累積的知識庫,Graphify 與 Andrej Karpathy 的 LLM Wiki 其實代表兩條不同路線:一條偏機器可遍歷的 graph,一條偏人類可閱讀的 wiki。這篇文章我會拆解兩者的核心差異、共同點,以及什麼情境下該單獨用、什麼情境下該一起用。
閱讀更多
你的 RAG 聊天機器人為什麼總是「失憶」?Mem0 可能是解答

你的 RAG 聊天機器人為什麼總是「失憶」?Mem0 可能是解答

RAG聊天機器人常「失憶」?本文深入介紹開源AI Agent記憶層Mem0,它透過提取、合併與檢索機制,為LLM提供個人化記憶能力,有效解決AI應用中用戶偏好無法被記住的痛點。文章詳解Mem0如何支援多用戶SaaS,並比較自建與託管方案。同時,將Mem0與LangChain Memory、Zep等方案比較,強調其在成熟度、彈性及不綁定LLM供應商的優勢。最終建議將RAG與Mem0疊加,打造兼具知識與個人化的AI體驗,預示AI記憶將成未來標準化基礎設施。
閱讀更多
Claude Code 的對話紀錄都去哪了?我做了一個 Viewer 來找回它們

Claude Code 的對話紀錄都去哪了?我做了一個 Viewer 來找回它們

Claude Code對話紀錄常因自動壓縮而遺失重要細節,影響開發者回顧。作者開發了Claude JSONL Viewer,一款純前端工具,能解析本機JSONL檔案,以友善介面呈現完整對話歷史,並提供子代理分離、搜尋等功能,且本地運行保障隱私。它旨在幫助開發者找回Claude Code的思考軌跡,提升開發效率。
閱讀更多
Gemini Skills:從零到實戰

Gemini Skills:從零到實戰

隨著 Gemini CLI 進入新世代,Skills 提供模組化的專業功能,可讓開發者在工作流程中即插即用。本文帶領你從背景說明、核心概念、競品比較、實踐心得、限制願景及個人觀點,完整理解 Gemini Skills 的價值與操作。全文靈活結合實例與技術细节,保留可持續擴充的空間。
閱讀更多