文章目錄
- 1 📘 方法論白皮書
- 2 《Stacked Harness Engineering:從提示詞操作到多模型意圖調度系統》
📘 方法論白皮書
《Stacked Harness Engineering:從提示詞操作到多模型意圖調度系統》
🧭 0. 核心問題定義
傳統 Prompt Engineering 的隱含假設是:
使用者知道自己要什麼,並且能精確描述
但現實是:
- 意圖是模糊的
- 情境是動態的
- 偏好是隱性的
- 成功標準是「看到才知道」
因此問題轉換為:
❌ 如何寫出正確 prompt
✅ 如何設計「讓 AI 自動收斂意圖的系統」
🧩 1. 兩個核心概念
1.1 套疊與修正(Stacking & Refinement)
不是一次生成,而是:
多層輸出 → 比對 → 修正 → 再生成
可以抽象成:
- 第 1 層:粗意圖生成(divergence)
- 第 2 層:結構收斂(alignment)
- 第 3 層:風格與語境修正(polish)
- 第 4 層:一致性驗證(consistency check)
📌 重點不是「生成一次」,而是:
讓錯誤在系統內被逐層消化
1.2 Harness Engineering(調度工程)
Prompt Engineering 在做的是:
「寫輸入」
Harness Engineering 在做的是:
「設計 AI 行為路徑」
包含四個層次:
(1) 模型選擇調度
- Model [A] / Model [B] / Model [C] / Model [D] 分工
(2) 任務拆解調度
- 分析 → 草稿 → 重寫 → 評審
(3) 風格對齊調度
- tone / persona / domain adaptation
(4) 反饋迴路調度
- output → critique → rewrite loop
📌 本質是:
不再控制 prompt,而是控制「生成系統」
🔁 2. 統一框架:Stacked Harness Loop
可以整合成一個閉環:
User Intent
↓
[Layer 1] Multi-model Divergence (發散)
↓
[Layer 2] Cross-model Comparison (對照)
↓
[Layer 3] Refinement Harness (收斂調度)
↓
[Layer 4] Style + Context Alignment
↓
Final Output
↓
Feedback Loop (回寫系統)
📌 關鍵思想:
AI 不是回答機器,而是「可調度的認知生產線」
🧠 3. 與傳統 Prompt Engineering 的差異
| 面向 | Prompt Engineering | Stacked Harness Engineering |
|---|---|---|
| 控制單位 | 文字輸入 | 系統行為 |
| 成功標準 | 一次正確 | 多輪收斂 |
| 錯誤處理 | 重寫 prompt | 系統內消化 |
| 多模型使用 | 可選 | 核心架構 |
| 使用者角色 | 提問者 | 編排者(conductor) |
⚙️ 4. 關鍵設計原則
原則 1:不追求一次正確
追求「可收斂」
原則 2:允許錯誤存在於系統內
不是避免錯誤,而是:
讓錯誤變成修正材料
原則 3:模型之間不是替代,而是互相校正
- GPT:結構化能力
- Claude:語意與語感
- Gemini:廣域整合
- Qwen:局部推理
📌 不是競爭,而是:
mutual correction system
原則 4:輸出不是終點,而是中繼狀態
🧠 5. 典型應用場景
(1) 技術文件生成
- 多模型產出 → merge → refine
(2) 知識庫建構(你這一塊核心)
- 工單 → 知識轉換 → domain taxonomy
(3) 行銷內容生成
- 風格分裂測試 → 收斂最佳版本
(4) 企業內部 AI 系統
- SOP + LLM orchestration
🧭 6. 戰略意義(這段很重要)
當 AI 普及後,競爭會從:
模型能力競爭
轉變為:
調度能力競爭(harness capability)
也就是:
誰能把 AI「組織成系統」,誰就擁有優勢
🔚 結語:從 prompt 使用者,到 AI 系統設計者
這個方法論的核心轉換是:
舊世界:
我問 AI 問題
新世界:
我設計 AI 如何思考問題
Comments