📘 方法論白皮書

《Stacked Harness Engineering:從提示詞操作到多模型意圖調度系統》


🧭 0. 核心問題定義

傳統 Prompt Engineering 的隱含假設是:

使用者知道自己要什麼,並且能精確描述

但現實是:

  • 意圖是模糊的
  • 情境是動態的
  • 偏好是隱性的
  • 成功標準是「看到才知道」

因此問題轉換為:

❌ 如何寫出正確 prompt
✅ 如何設計「讓 AI 自動收斂意圖的系統」


🧩 1. 兩個核心概念

1.1 套疊與修正(Stacking & Refinement)

不是一次生成,而是:

多層輸出 → 比對 → 修正 → 再生成

可以抽象成:

  • 第 1 層:粗意圖生成(divergence)
  • 第 2 層:結構收斂(alignment)
  • 第 3 層:風格與語境修正(polish)
  • 第 4 層:一致性驗證(consistency check)

📌 重點不是「生成一次」,而是:

讓錯誤在系統內被逐層消化


1.2 Harness Engineering(調度工程)

Prompt Engineering 在做的是:

「寫輸入」

Harness Engineering 在做的是:

「設計 AI 行為路徑」

包含四個層次:

(1) 模型選擇調度

  • Model [A] / Model [B] / Model [C] / Model [D] 分工

(2) 任務拆解調度

  • 分析 → 草稿 → 重寫 → 評審

(3) 風格對齊調度

  • tone / persona / domain adaptation

(4) 反饋迴路調度

  • output → critique → rewrite loop

📌 本質是:

不再控制 prompt,而是控制「生成系統」


🔁 2. 統一框架:Stacked Harness Loop

可以整合成一個閉環:

User Intent
    ↓
[Layer 1] Multi-model Divergence (發散)
    ↓
[Layer 2] Cross-model Comparison (對照)
    ↓
[Layer 3] Refinement Harness (收斂調度)
    ↓
[Layer 4] Style + Context Alignment
    ↓
Final Output
    ↓
Feedback Loop (回寫系統)

📌 關鍵思想:

AI 不是回答機器,而是「可調度的認知生產線」


🧠 3. 與傳統 Prompt Engineering 的差異

面向Prompt EngineeringStacked Harness Engineering
控制單位文字輸入系統行為
成功標準一次正確多輪收斂
錯誤處理重寫 prompt系統內消化
多模型使用可選核心架構
使用者角色提問者編排者(conductor)

⚙️ 4. 關鍵設計原則

原則 1:不追求一次正確

追求「可收斂」


原則 2:允許錯誤存在於系統內

不是避免錯誤,而是:

讓錯誤變成修正材料


原則 3:模型之間不是替代,而是互相校正

  • GPT:結構化能力
  • Claude:語意與語感
  • Gemini:廣域整合
  • Qwen:局部推理

📌 不是競爭,而是:

mutual correction system


原則 4:輸出不是終點,而是中繼狀態


🧠 5. 典型應用場景

(1) 技術文件生成

  • 多模型產出 → merge → refine

(2) 知識庫建構(你這一塊核心)

  • 工單 → 知識轉換 → domain taxonomy

(3) 行銷內容生成

  • 風格分裂測試 → 收斂最佳版本

(4) 企業內部 AI 系統

  • SOP + LLM orchestration

🧭 6. 戰略意義(這段很重要)

當 AI 普及後,競爭會從:

模型能力競爭

轉變為:

調度能力競爭(harness capability)

也就是:

誰能把 AI「組織成系統」,誰就擁有優勢


🔚 結語:從 prompt 使用者,到 AI 系統設計者

這個方法論的核心轉換是:

舊世界:

我問 AI 問題

新世界:

我設計 AI 如何思考問題

Last modified: 2026-05-09

Author

Comments

Write a Reply or Comment

Your email address will not be published.