Microsoft Build 2026：AI Agent 全栈时间线

微软一年一度的开发者大会 Build，2026 年回到了旧金山的线下现场。两天里它一口气发了 70 多条公告，听起来像一堆零散的产品名词。但如果你把它们排一排会发现：这些东西其实是一条完整的链子——微软想把「能替你干活的 AI 助手」从演示视频，变成真正能在公司里跑起来、还管得住的基础设施。这篇报告就帮你把这条链子理清楚，而且每个说法都能点开看到微软官方的原文。

🔬 我们想验证的一句话

Build 2026 上的 AI 公告不是各玩各的，而是同一件事的不同零件：微软在从最底层的「模型」一路往上，搭一整套让 AI 助手（agent）能可靠干活、又能被企业管住的系统。我们要验证：这条链子是不是真的成立，以及哪些已经能用、哪些还只是 PPT。

👥 这份报告适合谁看

用 AI 干活的人

开发者、产品、运营——想知道微软给了哪些新工具、哪些今天就能上手、哪些还要等。

重点看 → 模型层 · 应用层

做 AI 模型 / 工具的人

模型厂商、开源社区、工具创业者——看微软把自家模型摆在什么位置、又给第三方留了哪些接口。

重点看 → 模型层 · 运行时 · 治理层

微软 Azure 合作伙伴 / 销售

想拿这些新东西去跟客户讲故事——哪些是已经 GA（正式可卖）的、哪些还在预览、怎么组合成方案。

重点看 → 运行时 · 知识层 · 治理层

关心 AI 走向的人

投资人、行业观察者——看微软这盘棋的整体意图，以及哪些热度需要降温。

重点看 → 主线 · 对抗验证 · 结论

先帮你避开两个正在流传的误解

大会一开完，网上和媒体就传开了一些说法。我们逐条去核对了官方原文，发现下面这两个要么说错了、要么被夸大了。先讲清楚，免得你被带偏：

① 说法不准确

"Copilot 被重做成了能同时用 OpenAI、Anthropic、开源模型的平台"

能自由换开源模型的，是给开发者用的 Foundry，不是普通人用的 Copilot——这两个被说混了。
"重做"是媒体的说法，微软自己只说是"多给了几个模型选项"，没那么夸张。
而且 Copilot 能换模型这件事是今年 3 月就有的，不是这次 6 月大会的新闻；用 Anthropic 的模型还得管理员开开关、且只限部分地区。

② 说法被证伪

"Windows 的 AI 助手框架在这次大会正式发布了"

真正"正式发布"的，是能跨平台用的 Microsoft Agent Framework，而且它早在今年 4 月就发布了，不是这次大会。
这次大会上 Windows 自己专属的那套（Windows Agent Runtime 等）还只是内测 / 预览，要等到 Windows 11 下半年的更新才陆续推出。
换句话说：没有一个叫"Windows AI 助手框架"的东西在这次大会正式落地。

「AI 不会改变你的业务，运行它的系统才会。」

—— 微软 CEO 萨提亚·纳德拉，在 Build 2026 开场。他想说的是：光有一个聪明的 AI 没用，真正能改变工作的，是「让 AI 稳定干活的整套系统」——模型、它要懂的上下文、它能用的工具，缺一不可。

来源：Satya Nadella Opening Keynote（Microsoft Developer 官方） primary · 官方文字稿 primary · 精华版 Highlights · 全部 session 点播

这条「AI 助手全栈」从下往上分六层（42-research 据官方公告绘制）。橙色 = 已有正式可用的部分 / 蓝色 = 大多还在预览。下面一层层拆给你看。

01 模型层 · 最底下的「大脑」

微软自己造了 7 个 AI 模型

过去微软的 AI 很大程度上是转卖 OpenAI 的。这次，微软自己的 AI 团队（MAI，负责人 Mustafa Suleyman）一口气拿出 7 个自研模型，涵盖画图、语音、转写、推理、写代码。说白了：微软想把"AI 的大脑"攥在自己手里，不再处处看别人脸色。这是整套系统的地基。

Build 2026 keynote 舞台上展示的七个 MAI 模型 — 七个 MAI 模型在 Build 2026 keynote 舞台亮相。图 © Microsoft，引自 microsoft.ai。

新模型（5 基础 + 2 Flash）

模态：图像/语音/转录/思考/编码

第三方分发渠道

MAI 七模型家族（hill-climbing machine） Announced · 多为 preview

领队 Mustafa Suleyman / MAI愿景 "humanist super intelligence"训练 Maia 200 芯片

官方以 "hill-climbing machine"（迭代式自我改进，而非一次性巨型发布）框定战略，跨 图像 / 语音 / 转录 / 思考 / 编码 五类。
完整七模型名单：MAI-Image-2.5、MAI-Image-2.5-Flash、MAI-Transcribe-1.5、MAI-Voice-2、MAI-Voice-2-Flash、MAI-Thinking-1、MAI-Code-1-Flash。
★ 首次向第三方分发权重：除 Foundry 外登陆 Open Router / Fireworks / Baseten，客户可"自行调权重"——减少对 OpenAI 依赖的重大信号。语音模型防克隆、全程水印；官方称 1.4× 性能/瓦 on Maia 200 ⚠ 未独立验证。

来源：Building a hill-climbing machine · MAI keynote 文字稿 primary

MAI-Thinking-1（会"推理"的模型）还在小范围预览

规模中等（35B 参数级）能记多长 约 25 万字上下文训练没抄别人模型

这是微软第一个主打"会思考、会写代码"的模型。官方称它在最难的编程评测里答对约一半（SWE-Bench Pro 53%），和顶尖模型 Opus 4.6 一个水平，数学竞赛题也几乎全对 ⚠ 都是微软自己测的。
不过它现在只小范围开放预览——而且微软自己两份材料一处说预览、一处说已正式可用，我们以更具体的那份（预览）为准。

来源：MAI keynote 文字稿 primary

其余几个：写代码 / 画图 / 转写 / 语音部分已能用，陆续上线

写代码的 MAI-Code-1-Flash：体积很小（5B 参数），却号称编程评测答对一半（51%）、比同级更便宜 ⚠ 微软自测；已进 VS Code 等开发工具。
画图的 MAI-Image-2.5：官方称图像编辑排名第 2、超过谷歌 Nano Banana 2 ⚠，已经能在 PowerPoint 里用。转写的 MAI-Transcribe-1.5：支持 43 种语言、号称快 5 倍 ⚠。语音合成 MAI-Voice-2：15 种语言。

来源：Building a hill-climbing machine primary

这对你意味着什么

用 AI 的人

多了几个能选的模型，尤其写代码的 MAI-Code 很小、便宜，适合塞进日常开发工具里。

做模型 / 工具的人

注意这条：微软第一次把自家模型权重放到 Fireworks、OpenRouter 等第三方平台——它在抢"模型分发"的地盘。

Azure 合作伙伴

手里多了"微软自研、成本可控"这张牌，但多数还在预览，别急着承诺客户上线时间。

02 运行时层 · 让 AI 真正「跑起来」的地方

Foundry：把 AI 助手送进生产的"工厂"

很多 AI 助手能演示、却不敢真上线，因为不稳、不安全、出了问题查不到。Foundry 就是微软给出的答案：一个能让 AI 助手稳定运行、还能监控和管控的"生产车间"。这是整场大会最实打实的产品核心。

Microsoft Agent Platform 的 Build / Deploy / Operate 三层（42-research 据 Foundry devblog 绘制）。

11,000+

模型目录（官方宣称）

Model Router · Fireworks

1:1

每 session 独立 sandbox

Foundry：一个能用任何模型的平台预览中

能用的模型 OpenAI · Anthropic · 开源 · 微软自家

它原来叫 Azure AI Foundry，这次升级成统一平台；上周刚把 OpenAI 的实时语音和 Claude Opus 4.8 也接了进来。
"模型路由"（已正式可用）能按你的需求和预算自动挑最合适的模型——所以 Foundry 不绑死某一家，谁好用调谁；还能按需弹性分配 GPU 算力。
开源模型托管服务 Fireworks 也正式接入；官方称预览期已处理 1760 亿次调用、17 家世界 500 强在用 ⚠ 微软自测。

来源：What's new in Foundry · Foundry Models primary

Agent Service：托管 AI 助手的"运行环境" 预览，GA 时间存疑

不挑工具 微软/GitHub/LangGraph 等都能接

每个 AI 助手都跑在独立的"隔离小房间"里（有专属算力、内存、文件空间，互不干扰），能撑住那种过夜长跑、自己干活的任务。
还能让 AI 助手像员工一样有"身份"——发工牌、给邮箱、出现在 Teams、排进组织架构；也能定时自动跑、或几个 AI 互相调用（都还在预览）。
给 AI 加了"记忆力"：能记住做事的方法、记住你的偏好、记住当前对话（其中"方法记忆"官方称让任务成功率 +7~14% ⚠ 微软自测）。
⚠ 什么时候正式可用，微软自己两份材料说法打架（一处"30 天内"、一处"6 月底"），且官方文档 6/19 仍标"预览"。截至我们核对时还没正式发布。

来源：Build and run agents at scale with Foundry primary

这对你意味着什么

用 AI 的人

想做"能自己干活、过夜跑任务"的 AI 助手，现在有了官方的托管环境，不用自己搭服务器。

做模型 / 工具的人

它"不挑框架"——LangGraph 等你也能接。但也意味着微软想当那个"所有人都来接入"的中枢。

Azure 合作伙伴

这是最能讲给客户的"可落地"故事；Model Router、Fireworks 已正式可用，托管 agent 还在赶 GA。

03 知识层 · 让 AI「懂你的事」

Microsoft IQ：喂给 AI 的四种"知识"

模型再聪明，也不知道你公司内部的事。微软用四个"IQ"把不同知识喂给 AI：Work IQ（你的邮件/会议/文件）、Fabric IQ（公司的业务逻辑）、Foundry IQ（可复用的知识库）、Web IQ（实时网页）。合起来，AI 才答得到点子上。

四条 IQ 腿汇入同一个被 grounding 的 agent（42-research 绘制）。

+54%

recall（组合，厂商自测 ⚠）

6-16

Work IQ API 端点 GA

<165ms

Web IQ 延迟（官方 ⚠）

Foundry IQ（统一知识平面） Knowledge Bases GA · Serverless Preview

知识源 Work · Fabric · Azure SQL · File · MCPServerless $0.24/CU-hour · scale-to-zero

"知识库"功能已正式可用，而且不限自家——Claude、ChatGPT 等也能直接接来用。它把"让 AI 查资料再回答"（业内叫 RAG）这套以前要自己搭的麻烦活，做成了开箱即用的服务。
⚠ 被广泛引用的 "+54% recall"需校正口径：指 "evidence recall"；纯 knowledge base 只 +46%，+54% 需"小模型 + agentic retrieval"组合；基准 BrowseComp-Plus + 自家 gpt-5.4 ⚠ 厂商自测，"up to"为上界。

来源：Foundry IQ · +54% recall 评测原文 primary

Work IQ + Work IQ API Preview · API GA 6-16

捕捉工作如何真正发生（M365 邮件/会议/文件/Teams 信号），为所有 agent 提供共享智能层。
Work IQ API（端点 GA 定于 2026-06-16）三面暴露：A2A、远程 MCP server、REST；10 个通用工具收敛数百操作，独立于 Copilot 许可、按用量计费。

来源：Work IQ + API primary

Microsoft Web IQ Limited-access Preview

基于 Bing / Microsoft 网页索引（官方称已服务 10 亿+ 用户），跨 web / news / images / video / shopping 提供实时、带引用的 grounding；model-agnostic、MCP-native；官方称 sub-165ms · 零数据保留 ⚠。

来源：Announcing Microsoft Web IQ primary

这对你意味着什么

用 AI 的人

AI 终于能"懂你公司的事"了——读你的邮件、文件、会议，回答才靠谱，不再是聪明的陌生人。

做模型 / 工具的人

微软把"喂数据给 AI"做成了标准服务（还兼容 Claude/ChatGPT 接入）——自建 RAG 的活儿被它收编了一部分。

Azure 合作伙伴

知识库已正式可用，是企业落地的关键卖点；但那个"+54%"要讲清楚是特定组合下的、官方自测数字。

04 应用层 · 你真正会用到的 AI

看得见摸得着的 AI 助手

前面几层都是底子，这一层才是你天天会打开的：Scout（帮你盯任务、备会的随身助手）、能在 Teams 里协作的 AI、以及给程序员派活的 GitHub Copilot 桌面应用。

Scout 主动浮现任务的交互示意（42-research 绘制）。

Microsoft Scout（always-on 个人 agent） Announced

M365 中常驻个人 agent，主动浮现任务、准备会议、起草工作，跨 app/data 运作（Work IQ grounding）。
这是 Microsoft agent 平台最"看得见的脸"——把前面三层的能力收束成一个用户每天打开的入口。

来源：Introducing Microsoft Scout primary

协作 agent + Frontier Tuning + RLEs Preview / Announced

协作 agent：在工作发生处（Teams / M365）做 multi-agent 编排，agent 间与人协调，基于 M365 Agents SDK。
Frontier Tuning：通过 强化学习环境（RLEs）——官方称"AI 训练健身房"——在自有数据上定制 MAI 模型；官方称 Excel/McKinsey/Land O'Lakes 任务对标或超过 GPT-5.4/5.5 且省 10× ⚠。

来源：协作 agent · Frontier Tuning primary

GitHub Copilot app（agent-native 桌面） Announced

全新桌面 app，agent-native：从桌面把编码任务委派给 agent；keynote 把 GitHub 定位为"所有 agent 的控制平面"。

来源：GitHub Copilot app primary

这对你意味着什么

用 AI 的人

这是你真正会天天打开的东西：Scout 帮你盯任务、备会议、起草；开发者则多了个专门派活给 AI 的桌面工具。

做模型 / 工具的人

"Frontier Tuning"让企业能用自己的数据调出专属模型——定制化是这层的机会，也是竞争点。

Azure 合作伙伴

Scout、协作 agent 是最好讲给业务部门的故事；多为"已宣布"，落地时间要跟客户说清楚。

05 操作系统层 · AI 住进你的电脑

Windows 给 AI 助手划一道"安全围栏"

如果 AI 助手要在你自己的电脑上跑，系统得先管住它——不能让它乱翻文件、乱动设置。Windows 这次就是在做这道"围栏"。提醒：这一层也是被媒体夸大最多的地方，多数还没真正落地。

Windows 给 agent 一道权限边界，不能自由访问全系统（42-research 绘制）。

Windows platform security for AI agents Announced · 专属栈为 alpha/preview

为 OS 上运行的 agent 引入安全模型：作用域身份 / 权限 / 审计 / 隔离，agent 不能自由访问全系统。
⚠ 厘清两个被混淆的东西：达 GA 的是跨平台的 Microsoft Agent Framework (MAF)（.NET/Python SDK，2026-04-02 就 1.0 GA、先于 Build）；Build 上的 Windows 专属栈（Windows Agent Runtime / MXC / OpenClaw on Windows）是 alpha / preview，随 Windows 11 26H2（2026 下半年）推出。"Windows Agent Framework 已 GA"不成立。

来源：Windows platform security for AI agents · MAF（4/2 已 1.0 GA） primary

Project Solara + Surface RTX Spark Dev Box Announced

Project Solara：面向 agent-first 设备的新平台，围绕"agent 作为主要执行者"重构设备/OS 栈——长周期愿景。
Surface RTX Spark Dev Box：专用本地 AI 开发硬件，借 NVIDIA RTX 在本地跑模型/agent——云端 Foundry 的"本地对位"。MAI 模型也将"几个月内"登陆 Windows 上的 N1X。

来源：Project Solara · Surface RTX Spark Dev Box primary

这对你意味着什么

用 AI 的人

未来 AI 助手能在你自己的电脑上跑，且被关进"安全笼子"——不能乱翻你的文件和系统。但这些大多要等 Windows 下半年更新。

做模型 / 工具的人

本地跑 AI 的硬件（Surface Spark）和设备平台（Project Solara）是新战场，但目前都还早。

Azure 合作伙伴

⚠ 这层最容易被媒体夸大——除了一道安全模型，专属栈基本是预览/愿景，别当成现成方案卖。

06 治理层 · 让老板敢用 AI

怎么管住 AI，让它能进公司

企业让 AI 干活，最怕的是"出错谁担责、会不会泄密、值不值这个钱"。这一层就是回答这些：给 AI 立规矩、全程留痕、能评估、算得清回报。而且微软把这套工具开源、还不绑自家平台——它想当行业的"安全标准"。

Agent Control Spec 在循环 5 个检查点施加确定性护栏（42-research 绘制）。

两套开放的"AI 管控标准"：ASSERT 和 ACS ASSERT 已开源

谁能用 不限微软，各家工具都能接已采用 KPMG · Zscaler · IBM 等

ASSERT（已开源）：帮你把公司的规矩翻译成"自动检查项"，再拿这些项去考 AI、挑它的毛病。微软明说它不绑自家平台，是想给全行业的 AI 开发者用。
ACS：一套给 AI 立规矩的通用标准——在 AI 干活的5 个关键环节（收到指令、调用模型、改状态、动用工具、输出结果）各设一道关卡，规则还能在不同平台之间搬。

来源：Open trust stack（ASSERT/ACS） primary

跨框架可观测（GA）+ Foundry 内护栏 + Agent ROI Tracing&Eval GA · 其余 Preview

Tracing & Evaluations 达 GA（6/3，基于 OpenTelemetry，支持 LangChain/LangGraph/OpenAI SDK/MAF），端到端追踪 prompt/模型/工具/子 agent。
Foundry 内：Guided Guardrail Setup、Rubric Evaluator、Runtime DLP（均 Preview）、Purview Insights 达 GA；Agent Optimizer（私有预览→本月公开）；ROI for Agents（私有预览）跟踪完成率/省时/成本。

来源：Observability to ROI primary

跨 SDLC 安全（Agent 365 式治理） Preview

保护 code / agents / models（Defender + Entra Agent ID + Purview）；每个 agent 有身份并受治理，含态势管理与 AI workload 威胁防护。

来源：Securing code, agents & models across the SDLC primary

这对你意味着什么

用 AI 的人

让 AI 进公司，老板最担心的是"出了错谁负责、会不会泄密"。这层就是回答这个——可追溯、能管控、算得清账。

做模型 / 工具的人

微软把这套（ASSERT、ACS）开源、且不绑自家平台——它想定行业的"安全标准"，值得关注能否跟进。

Azure 合作伙伴

"安全可治理"是说服大企业的关键筹码，跨框架可观测已正式可用，可以直接讲。

07 数据与科学 · 已经在落地

连数据库都开始"为 AI 改造"，科研已用上

主线之外还有个值得看的信号：连数据库都在为 AI 优化（更好地存记忆、做检索）。更实在的是 Microsoft Discovery——它是全场少数"已经正式可用"的，而且已经在帮 Mayo Clinic 做医疗科研，不只是演示。

数据库变得 agent-aware；Discovery 率先 GA（42-research 绘制）。

Fabric IQ + Cosmos DB + Azure HorizonDB Preview

Fabric IQ 建模业务如何运作（语义/本体层，即 Microsoft IQ 的"业务"那条腿）；GPU 加速 Fabric 数仓官方称 7× 性能 ⚠。
Cosmos DB 加 agent memory toolkit / agentic retrieval / semantic reranking；Azure HorizonDB（托管 PostgreSQL）：zone-redundant、自动故障转移、128TB/集群 · 15 读副本 · 3× 吞吐 ⚠。

来源：Agentic apps with Fabric & Databases primary

Microsoft Discovery GA

面向科研 R&D 的 agentic AI 平台达 GA（全场少数非 preview 公告之一），Discovery app 进入 preview。
用于 Mayo Clinic 前沿医疗 AI 合作（其平台称覆盖约 1 亿人/四大洲）——agentic AI 真正落到科学与医疗。

来源：Microsoft Discovery GA primary

这对你意味着什么

用 AI 的人

连数据库都开始"为 AI 优化"了——存记忆、做检索更顺手。普通人更直观的信号是：Discovery 已经在帮医院做科研。

做模型 / 工具的人

数据层（Fabric、HorizonDB）是 AI 应用的底座，微软在这里也下重注，是上下游机会。

Azure 合作伙伴

Discovery 是全场少数"已正式可用"的，且有 Mayo Clinic 这样的标杆案例——最好拿去讲的成熟方案。

我们专门去挑了 5 个刺

为了不被宣传带节奏，我们专门反着来——挑 5 个最响亮的说法，逐个去查官方原文能不能站得住。结论：大方向是真的，但有些"亮点"经不起"是不是已经能用了"的追问——一个被直接证伪，其余多是"还在预览"或"厂商自己测的数字"。

恰好 7 个 MAI 模型需注意

"seven"被两个一手源逐字确认，但 = 5 基础 + 2 Flash 变体；"announced"准确，"launched / 已 GA"夸大。

Copilot 跨 OpenAI/Anthropic/开源多模型需校正

开源模型是 Foundry 能力、不在 Copilot 产品里；"重建"是记者措辞；且这是 2026-03 的事、早于 Build。

Foundry Agent Service 7 月初 GA时效敏感

两官方源时间冲突（"next 30 days" vs "end of June"），Learn 6/19 仍标 preview。

Windows Agent Framework 已 GA已证伪

达 GA 的是跨平台 MAF、且 4/2 就 GA；Windows 专属栈是 alpha / preview。

Foundry IQ recall +54%vendor benchmark

纯 knowledge base 只 +46%，+54% 需"小模型 + agentic retrieval"组合；厂商自测未独立验证。

✅ 一句话总结

我们想验证的那条主线是真的：Build 2026 的一堆公告，确实能串成一条从下到上的完整链子——模型 → 运行车间 → 知识 → 应用 → 操作系统 → 管控，而且每一环都能在微软官方原文里找到出处。纳德拉那句"光有聪明 AI 没用，要有让它干活的整套系统"，就是这条链子的设计思路。

但别被热度冲昏头：这条链子里大部分还在"预览"阶段，不是马上能用（真正已正式可用的只有少数几个：Microsoft Discovery、Foundry 知识库、模型路由、跨框架监控）；那些亮眼的数字（+54%、省 10 倍等）都是微软自己测的，没有第三方验证；还有两个流行说法被我们纠正了。蓝图很清晰，但能不能落地还得等。给你最实在的一句：愿景是"一整套 AI 助手基础设施"，但今天真能押上去用的，还只是其中少数已经正式发布的部分。

📚 引用与来源（一手优先，完整清单见 sources.md）

Build 2026 官方新闻 hub（主索引） primary

MAI keynote 官方文字稿 · 7 个 MAI 模型 primary

What's new in Microsoft Foundry · Foundry Agent Service primary

Foundry IQ · +54% recall 评测 primary

Open trust stack（ASSERT/ACS） · MAF（4/2 已 1.0 GA） primary

Work IQ + API · Microsoft Web IQ primary

Microsoft Scout · GitHub Copilot app · Copilot 多模型（早于 Build） primary

Windows platform security for AI agents · Project Solara primary

Agentic apps with Fabric & Databases · Microsoft Discovery GA primary

Build 2026 Satya Nadella Opening Keynote（官方完整视频） · 官方 session 目录 primary

⚠️ 局限与存疑（research 诚实性）

Foundry Agent Service / 托管 agent 是否如期 GA——"next 30 days" vs "end of June" 两官方源冲突，Learn 6/19 仍标 preview；需 7 月后回看兑现。
MAI-Thinking-1 的真实状态——transcript 称私有预览、blog 概述称 GA，源内冲突未解。
Windows 专属 agent 栈的成熟度与最终命名——随 Windows 11 26H2 推出，2026 下半年才见分晓。
所有厂商 benchmark（MAI 各项 / +54% recall / 省 10× / 7× 数仓 / 3× HorizonDB）无独立第三方复现，仅作"官方宣称"呈现。
配图中标 "© Microsoft" 者为官方素材外链引用（hero 主视觉、keynote 舞台照，均自 microsoft.ai，带来源标注，用于评论/研究）；其余标 "42-research 绘制" 者为自绘 SVG 示意图（自包含、矢量、无外部依赖）。
官方 hub 共 70+ 公告，本课题聚焦 AI 主线约 25 条；非 AI-核心条目（Azure Cobalt 200 / Azure Linux 4.0 / 量子 Majorana 2 等）未纳入主体。

42-research · 本产物为自包含语义化 HTML，遵循 schema.org/ScholarlyArticle。真相源在 git，查询索引在 D1，方法论见 docs/methodology。所有文字来源回到 Microsoft 官方一手，采集于 2026-06-22。