老牌數據分析大廠揭AI Coding實戰經驗，要量化AI工具成效與成本

新聞

以大數據分析起家的AI軟體大廠SAS也面臨這個課題，SAS全球研發資深副總裁Jared Peterson在本月SAS Innovate 2026大會上受訪時透露，他們的做法是建立一套衡量機制，來追蹤、比較使用AI輔助開發產生的費用，以及工程師與AI協力產出的程式碼品質和合格數量，再調整投資力道。

不只啟動企業級AI採用計畫，也開始衡量AI輔助開發效益

Jared Peterson帶領SAS全球研發團隊，主導SAS資料與AI平臺的產品開發。他表示，早在生成式AI工具普及前，他的團隊就已採用規格驅動開發（SDD）模式，也就是先定義需求和規格，再由AI產生程式碼，工程師再來調整、迭代。

隨著AI Coding工具快速成熟，SAS也持續擴大內部使用。Jared Peterson指出，SAS內部發起一套橫跨全組織的AI輔助開發計畫，不單單針對研發單位，而是涵蓋所有部門。這項計畫除了鼓勵員工使用AI工具，也特別重視AI投資是否產生效益。

以Jared Peterson帶領的研發團隊為例，大部分開發者主要使用GitHub Copilot這套AI輔助開發工具，而部分被認定為高效使用者（Power users）的工程師，則會進一步取得Claude Enterprise授權版本工具。

其中，SAS會比較不同AI Coding工具的成效，比如，同一批工程師使用GitHub Copilot和Claude Enerprise生成程式碼的品質差異。Jared Peterson透露，目前確實觀察到，部分高效使用者，用Claude生成的程式碼品質更高。但他也點出，主因未必是背後的模型能力差異，有可能是工程師懂如何使用AI工具後，能更有效使用這類工具。

與此同時，SAS也會定期追蹤多項AI Coding指標，例如工具使用率、AI生成程式碼被接受的比例（Accepted lines of code），以及相對應增加的雲端成本，來評估AI是否真的提高開發效率。

如何確保模型選對MCP工具？關鍵是情境工程

除了AI輔助開發，Jared Peterson也進一步說明常見的代理型AI（Agentic AI）架構。

他以生成式AI助手Copilot為例，Copilot就像是使用者互動介面（UI）角色，真正執行邏輯與任務協調的，其實是背後的AI代理（AI Agent），而大語言模型（LLM）則負責理解使用者意圖。這些代理可能單一支執行任務，也可能多支合作，但不論如何，為完成執行任務，代理會透過MCP伺服器來選擇、呼叫適合的工具。

不過，企業建立多代理和MCP架構後，往往會遇到選錯工具的問題，比如代理挑錯工具、Copilot可能誤解使用者需求，或是多代理協作流程不如預期。Jared Peterson指出，這時候，企業需要做的是情境工程（Context Engineering）。

他解釋，情境工程是透過指令、文字描述和上下文限制，不斷縮小LLM可使用的資訊空間，讓模型更容易做出符合預期的選擇。

例如在MCP架構中，每個工具都會附帶文字描述，供AI代理和LLM判斷，哪些工具最適合當下的任務。而情境工程的目的，就是持續優化這些上下文資訊與限制條件，降低模型誤判或選錯工具的機率。

Jared Peterson也坦言，自家幾乎所有Agentic AI的產品背後，都大量使用情境工程技術。

代理型AI要有效好用，得先判斷題目的確定性

至於代理型AI能否解決企業問題，Jared Peterson認為，企業在導入前，必須先理解哪些場景可以接受LLM的不確定性，哪些不能，也就是先判斷這個問題是否需要穩定、可重現的答案，即確定性（Deterministic）與不確定性（Non-deterministic）系統的差異。

尤其，在金融、醫療與政府等高度監管領域，企業往往需要可解釋、可驗證、可重現的決策結果，因此Jared Peterson認為，最理想的做法，不是完全依賴LLM，而是將傳統確定論系統和生成式AI能力，都整合在同一平臺中，再依不同需求選擇適合技術，這也是SAS目前主打的可信任AI服務核心，不是完全取代傳統系統，而是讓生成式AI與既有的決策系統共同運作。

老牌數據分析大廠揭AI Coding實戰經驗，要量化AI工具成效與成本

不只啟動企業級AI採用計畫，也開始衡量AI輔助開發效益

如何確保模型選對MCP工具？關鍵是情境工程

代理型AI要有效好用，得先判斷題目的確定性

Comments (0)