🚀 2026 · 學習路線圖

AI Agent
系統學習指南

一張精心策劃的學習地圖:9 個階段、23 個動手練習、240+ 精選資源。
從 Prompt Engineering 到 Harness Engineering,從零到生產級 Agent。

0
學習階段
0
動手練習
0
精選資源
0
MCP / Skills
開始學習 →
選擇你的路線

兩條學習路徑

共享 Stage 0-2 基礎之後,根據你的目標選擇 CLI 能力者之路或 Agent 構建者之路。

⌨️
Track A — CLI 能力者
⏱ 8–10 週
熟練使用現有 CLI Agent 工具(Claude Code、Codex、Gemini CLI)。適合 PM、知識工作者、想快速提效的人。
CLAUDE.md Slash 命令 MCP 整合 GitHub Actions 成本追蹤
🛠
Track B — Agent 構建者
⏱ 16–22 週(約 5–7 個月)
從零構建自己的 Agent 系統。涵蓋 Tool Use、框架對比、RAG、多 Agent、部署。適合開發者、研究者。
Function Calling LangGraph CrewAI RAG FastAPI Docker
⌨️ Track A · CLI 三步走
🎯 按角色選擇路徑

五種角色的專屬路線

不同職業對 AI Agent 的需求不同——這裡為 5 種典型角色設計了對應的學習路徑與重點。

💻
給開發者
已有編程基礎,想構建生產級 Agent 系統。重點:Tool Use、框架、部署、可觀測性。
Track B 主修
🔬
給研究者
學術或工業研究背景,關注 Agent 評估與前沿。重點:Eval 方法、論文閱讀、可重現實驗。
Track B + 7.5
📊
給知識工作者
PM、分析師、運營人員。重點:CLI Agent 提效、MCP 整合 Office、自動化日常工作。
Track A 主修
🎓
給教師
教育工作者,想把 AI 融入教學。重點:Skills 設計、課件生成、學生反饋分析。
Track A + Stage 5
👥
給普通用戶
沒有編程背景,想理解並用好 AI 工具。重點:Prompt 技巧、CLI 入門、避坑指南。
Stage 0-2 + Track A
核心知識框架

概念三層演進

這個項目最重要的知識框架——從寫好提示詞,到管理上下文,到讓 Agent 行為框架本身可編程。

Harness Engineering
Stage
7
Context Engineering
Stage
3+
Prompt Engineering
Stage
2
Prompt Engineering
寫好提示詞是起點。學習 System Prompt、Few-shot、Chain-of-Thought 等技術,讓 LLM 按你的意圖輸出。
完整學習路徑

Stage 0 → 8 全覽

點擊每個階段展開查看練習、資源和學習目標。
💡 提示:點擊任意練習卡片可查看該練習的完整 README。

⌨️ Track A · CLI 能力者之路(8–10 週)

適合 PM、知識工作者、想快速提效的人。專注於熟練使用 Claude CodeCodexGemini CLI 等現有工具,不寫代碼。

路徑:Stage 0-2 共修基礎 → 跳過 Stage 3/4/6/7(編程內容)→ 直接學 Stage 5(Claude Code 生態)+ Stage 7.5(高階概念)+ Stage 8(Agent 接口)。同步學 tracks/cli/ 三個專屬文檔(A1/A2/A3)。

📖 開始 A1: CLI Agent 入門 →

🛠 Track B · Agent 構建者之路(16–22 週,約 5–7 個月)

適合開發者、研究者,想從零構建自己的 Agent 系統。覆蓋 Tool Use、框架對比、RAG、多 Agent、生產部署等全棧能力。

路徑:從 Stage 0 一路打到 Stage 8。Stage 3-4 是 Agent 構建轉折點,Stage 6 是記憶/RAG,Stage 7 是生產級 + 可觀測性。配合 walkthroughs/build-first-agent-in-7-steps 端到端實戰。

📖 開始:7 步構建第一個 Agent →
0

環境準備 — Foundations A+B 共修

⏱ 1–2 週 · 🔧 兩條 Track 共修

學什麼:Python 基礎、CLI 操作、Git 版本控制、API 概念、JSON 格式。這是一切的起點——確保你的開發環境就緒。

動手做:安裝 Ollama → 拉取 gemma4:e4b 模型(約 7.5GB)→ 運行第一個本地 LLM 對話。

1

LLM 基礎 — Language Model Basics A+B 共修

⏱ 1 週 · 🔧 兩條 Track 共修 · 2 個練習

學什麼:Token 概念、API 調用方式、LLM 供應商對比、本地 vs 雲端 LLM 的取捨。理解 LLM 的本質——一個概率性的文本生成器。

04-cross-provider
多供應商 LLM 調用——同一個請求發給不同模型
OllamaAnthropic$0
05-error-handling
OpenAI SDK 異常處理 + 重試包裝器
OllamaAnthropic
2

Prompt Engineering — 提示詞工程 A+B 共修

⏱ 1–2 週 · 🔧 兩條 Track 共修 · 內嵌練習

學什麼:System Prompt 設計、Few-shot 示例、Chain-of-Thought 推理鏈、Context Engineering 入門。這是概念三層演進的第一層。

練習形式:內嵌在 stage 文檔的 <details> 折疊塊中,每個練習 8-15 行核心代碼。

3

Tool Use + 第一個 Agent ⭐ Track B

⏱ 2–3 週 · 🛠 Track B 核心 · 5 個練習

學什麼:Function Calling、ReAct 循環、工具選擇策略、Schema 設計。這是從使用者到構建者的轉折點——你將手寫第一個 Agent 循環。

02-multi-tool-selection
多工具選擇——Agent 如何決定用哪個工具
OllamaAnthropic
03-react-from-scratch
⭐ 手寫 ReAct 循環——最重要的練習
OllamaAnthropic
04-multi-step-reasoning
多步推理鏈——複雜任務分解
OllamaAnthropic
05-error-handling
Agent 上下文中的錯誤處理
OllamaAnthropic
06-schema-design
Schema 設計好/壞對比(含 bad + good 版本)
OllamaAnthropic
4

Agent 框架 — Frameworks Track B

⏱ 2–3 週 · 🛠 Track B 核心 · 5 個練習

學什麼:LangGraph、CrewAI、Smolagents、Pydantic AI 四大框架對比。理解不同框架的設計哲學——圖狀態機 vs 角色扮演 vs CodeAct vs 類型安全。

01-same-agent-two-frameworks
同一 Agent 用 LangGraph vs CrewAI 實現
OllamaAnthropic
02-multi-agent-roles
CrewAI 多角色分配——讓 Agent 扮演不同專家
OllamaAnthropic
03-graph-workflow
LangGraph 分支 + 人類審批(HITL)
OllamaAnthropic
04-codeact-vs-json-tool
Smolagents CodeAct vs JSON 工具調用
OllamaAnthropic
05-typed-agent
Pydantic AI 類型化輸出——結構化數據保證
OllamaAnthropic
5

Claude Code 生態 — Ecosystem 🔗 A+B 共修

⏱ 3–4 週 Track B / 1–2 週 Track A · 兩條 Track 共享

學什麼:MCP Server 協議、Skills 系統、Plugins 架構、Subagents 子代理。這是 Claude 生態的全景圖——從工具協議到技能系統到多代理編排。

已有的 meta 示例:tool-calling-tutor — 一個可安裝的 Claude Code Skill,用於診斷 tool-calling 問題。

tool-calling-tutor
⭐ Meta 示例:可安裝的 Claude Code Skill
Skill$0
6

Memory + RAG — 記憶與檢索 Track B

⏱ 2 週 · 🛠 Track B 核心 · 5 個練習

學什麼:向量數據庫、Embedding 原理、文檔分塊策略、完整 RAG 管道、Agent 長期記憶。讓你的 Agent 擁有「記憶」——能記住對話歷史和外部知識。

01-embeddings
文本 Embedding 基礎——語義向量化
OllamaAnthropic
02-vector-db
ChromaDB 向量數據庫操作
OllamaAnthropic
03-chunking-comparison
文檔分塊策略對比——固定 vs 語義
OllamaAnthropic
04-full-rag-pipeline
⭐ 完整 RAG 管道——端到端實現
OllamaAnthropic
05-long-term-memory
Agent 長期記憶——跨會話記憶持久化
OllamaAnthropic
7

多 Agent + 生產級 — Production Track B

⏱ 2–4 週 · 🛠 Track B 核心 · 5 個練習

學什麼:多 Agent 編排模式、Agent 評估方法、可觀測性/監控、高級 SDK(Streaming + Caching)、FastAPI 部署。這是概念三層演進的頂層——Harness Engineering。

01-multi-agent-debate
多 Agent 辯論模式——觀點碰撞
OllamaAnthropic
02-eval
Agent 評估——如何衡量 Agent 好壞
OllamaAnthropic
03-observability
可觀測性/監控——看透 Agent 內部
OllamaAnthropic
04-sdk-advanced
Streaming + Caching 高級技巧
OllamaAnthropic
05-deploy
FastAPI 部署(含 Dockerfile)
OllamaAnthropic
7.5

高階概念閱讀圖 — Advanced Concepts A+B 共修

⏱ 1 週 · 📖 純理論 · 無代碼

學什麼:12 個高階概念的閱讀地圖:PAR 循環(Plan-Act-Reflex)、Agent-as-Judge、Guardrail 模式、Reflexion 持久記憶迴圈等。沒有代碼,純粹的概念理解。

定位:這是 Stage 7 到 Stage 8 之間的「橋樑」——用一週時間消化高階概念,為最後的 Agent 接口學習做準備。

純理論無代碼
8

Agent 接口 — Interfaces 🔗 A+B 共修

⏱ 2–3 週 · 兩條 Track 共享 · 內嵌練習

學什麼:Computer Use(屏幕操控)、Browser Use(網頁瀏覽)、Code Sandbox(代碼沙箱)。讓 Agent 不僅能對話,還能「看見」和「操作」真實世界。

練習形式:練習內嵌在 stage 文檔中,因為涉及特殊環境(瀏覽器、屏幕錄製等)。

標準操作流程

每練習的七步法

每個練習文件夾遵循統一結構。按以下順序操作,最大化學習效果。

1

讀 README

選擇你的語言版本(zh-TW / zh-Hans / English),理解練習目標和預期成果。

2

安裝依賴

requirements.txt,執行 pip install -r requirements.txt。注意同時包含 openai 和 anthropic SDK。

3

自己先嘗試

⚠️ 關鍵:starter.py 是完整解答,不是 TODO 骨架。先自己嘗試寫,哪怕寫不出來也沒關係。

4

對照學習

starter.py(Path A: Ollama),理解差距。運行它,觀察輸出。看末尾的 # === 自我驗證 === 塊。

5

跑測試驗證

執行 pytest test.py 驗證理解。測試使用 mock,不需要真實 API 調用。

6

(可選)雲端對比

starter_anthropic.py(Path B: Anthropic),對比本地 vs 雲端的實現差異。pytest test_anthropic.py

7

📚 深度路由

看 README 的 📚 callout,路由到 Datawhale hello-agents、Anthropic Cookbook 等深度教程繼續學習。

知識地圖

資源層速查

當你需要深入某個主題時,查閱 resources/ 下的專項指南。每個主題都有三語版本。

📚
術語表 Glossary
30+ 術語,每個 30-80 詞,帶階段交叉引用。遇到不懂的概念先查這裡。
全程適用
🧠
Agent 範式
5 種 Agent 範式心智模型:ReAct、Plan-and-Execute、Reflection、Multi-Agent、Tool-Use。
Stage 3+
📐
Schema 速查表
5 條黃金法則 + 5 個反模式。Function Calling 的 Schema 設計指南。
Stage 3
🔌
MCP / Skills 目錄
62 個 MCP Server / Skills,分 6 類,帶 GitHub 星數和評分。
Stage 5
🤖
子 Agent 菜譜
15 個即用子 Agent 調度模板,可直接複製貼上使用。
Stage 5
🔬
子 Agent 進階
Description Bug、組合模式、調試技巧。深入理解子代理的坑和最佳實踐。
Stage 5+
🍳
實操菜譜
6 個 30-50 分鐘的 step-by-step 菜譜:Skills、MCP、Office 整合。
Stage 5
🎓
線上課程
10 個有證書的可信 AI Agent 線上課程,附評價和適合人群。
全程適用
⌨️
CLI Agent 指南
7 個 CLI Agent 對比 + 決策矩陣。選哪個 CLI 工具?看這裡。
Track A
🚀
環境搭建
30-45 分鐘從零到 Hello World。API Key、Python、Ollama 全搞定。
Stage 0
🗺
7 步構建第一個 Agent
端到端 walkthrough:從 Stage 1 到 Stage 7,構建一個 Paper Summary Bot,約 350 行真實代碼。
Track B
🏆
Capstone 項目
Track A + Track B 各一個畢業項目,附 4 級評分標準(Rubric)。
最終檢驗
✏️
內容風格指南
本專案的寫作規範:術語、語氣、結構、代碼範例風格。貢獻內容前必讀。
貢獻者
📂
Resources 索引
resources/ 目錄完整索引——找不到時來這裡。
全程適用
成本規劃

學習預算

三種預算方案,從完全免費到全雲端。推薦混合方案——本地練習 + 雲端對比。

方案說明預算
全本地 Ollama所有練習用本地 LLM,零 API 費用$0
混合推薦 ⭐本地練習(Path A)+ 雲端對比(Path B,用 Haiku)$2–5
全 Sonnet所有練習用 Claude Sonnet,最高質量$20–50

模型選擇建議:
Stage 1-2 用 gemma4:e4b(本地,$0)
Stage 3+ 用 qwen2.5:3b(本地,$0,可靠的 tool-use 支持)
雲端對比用 claude-haiku-4-5($1/$5 per 1M tokens,最便宜)

loading...
⏳ Loading markdown content...