Foundry 模型：部署策略

這一頁幫你搞清楚三件事：Foundry Models 是什麼、部署模型代表什麼、這個 workshop 真正依賴哪些模型。

先記住五件事

Foundry Models 是模型目錄加部署入口，不是單一模型。
程式裡呼叫的是 deployment name，不只是模型家族名稱。
不是每個模型都支援每種 deployment type，也不是每個區域都能部署。
主流程只需要 chat model 和 embedding model；image model 是選配。
region 與 quota 是最常見的部署限制。

三個核心概念

概念	白話	官方文件
model	你選的模型能力（聊天、嵌入、影像）	Foundry Models overview
deployment	你在自己資源裡建立的可呼叫實例	Deploy models
deployment type	這個實例的計價、吞吐與資料處理方式	Deployment types

這個工作坊用到哪些模型

模型角色	預設部署	是否必要
聊天模型（負責「想」）	`gpt-5.4-mini`	是
向量嵌入模型（負責「找」）	`text-embedding-3-large`	是
影像模型	`gpt-image-1.5`	否

只要聊天和嵌入兩個角色正常，主流程就能成立。

azd up 會額外嘗試的選配模型

azd up 會用 best-effort 方式額外建立一組 default OpenAI deployments，供手動實驗或模型比較使用。即使部分因區域或 quota 無法建立，也不影響主線。完整清單請見部署基礎架構。

在流程中的位置

flowchart LR
    A[使用者提問] --> B[聊天模型]
    B --> C{需要文件證據嗎}
    C -->|是| D[向量嵌入模型先把文件建成索引]
    D --> E[Azure AI Search 找到相關段落]
    E --> B
    C -->|否| B
    B --> F[整理最終回答]

Deployment type 速查

類型	重點	什麼時候在意
`GlobalStandard`	pay-per-token，全球路由	多數 PoC 的起點
`Standard`	單一區域，pay-per-token	在意資料處理位置時
`Provisioned`	保留容量，吞吐可預期	高流量、穩定延遲
`Batch`	非即時、大量、成本低	非同步大批次

本 workshop 預設使用 GlobalStandard。不是每個模型都支援所有 type。

部署卡住時先查這四件事

問題	說明
deployment name 命名混亂	playground 與程式都靠 deployment name 路由，命名要清楚
region 不支援	即使模型存在，你選的區域或 type 也可能不支援
quota 不足	部署失敗時，先查 region 和 quota，不是先懷疑程式
Marketplace 訂閱	僅 partner/community 模型需要；Azure Direct 路徑通常不用

常見問題

選配模型部署失敗怎麼辦？ 主流程仍可繼續。這也是把必要和選配模型分開的原因。

為什麼不用一個模型全部處理？ 文件檢索和對話回應是兩種不同工作，拆開更穩定、更容易維護。

需要理解 managed compute 和 serverless 嗎？ 先不用。先把「chat + embedding」和「deployment type / region / quota」弄清楚就夠了。

官方延伸閱讀

← 深入解析 | Foundry IQ：文件智慧 →