微软一年一度的开发者大会 Build,2026 年回到了旧金山的线下现场。两天里它一口气发了 70 多条公告,听起来像一堆零散的产品名词。但如果你把它们排一排会发现:这些东西其实是一条完整的链子——微软想把「能替你干活的 AI 助手」从演示视频,变成真正能在公司里跑起来、还管得住的基础设施。这篇报告就帮你把这条链子理清楚,而且每个说法都能点开看到微软官方的原文。
🔬 我们想验证的一句话
Build 2026 上的 AI 公告不是各玩各的,而是同一件事的不同零件:微软在从最底层的「模型」一路往上,搭一整套让 AI 助手(agent)能可靠干活、又能被企业管住的系统。我们要验证:这条链子是不是真的成立,以及哪些已经能用、哪些还只是 PPT。
👥 这份报告适合谁看
用 AI 干活的人
开发者、产品、运营——想知道微软给了哪些新工具、哪些今天就能上手、哪些还要等。
重点看 → 模型层 · 应用层
做 AI 模型 / 工具的人
模型厂商、开源社区、工具创业者——看微软把自家模型摆在什么位置、又给第三方留了哪些接口。
重点看 → 模型层 · 运行时 · 治理层
微软 Azure 合作伙伴 / 销售
想拿这些新东西去跟客户讲故事——哪些是已经 GA(正式可卖)的、哪些还在预览、怎么组合成方案。
重点看 → 运行时 · 知识层 · 治理层
关心 AI 走向的人
投资人、行业观察者——看微软这盘棋的整体意图,以及哪些热度需要降温。
重点看 → 主线 · 对抗验证 · 结论
先帮你避开两个正在流传的误解
大会一开完,网上和媒体就传开了一些说法。我们逐条去核对了官方原文,发现下面这两个要么说错了、要么被夸大了。先讲清楚,免得你被带偏:
① 说法不准确
"Copilot 被重做成了能同时用 OpenAI、Anthropic、开源模型的平台"
- 能自由换开源模型的,是给开发者用的 Foundry,不是普通人用的 Copilot——这两个被说混了。
- "重做"是媒体的说法,微软自己只说是"多给了几个模型选项",没那么夸张。
- 而且 Copilot 能换模型这件事是今年 3 月就有的,不是这次 6 月大会的新闻;用 Anthropic 的模型还得管理员开开关、且只限部分地区。
② 说法被证伪
"Windows 的 AI 助手框架在这次大会正式发布了"
- 真正"正式发布"的,是能跨平台用的 Microsoft Agent Framework,而且它早在今年 4 月就发布了,不是这次大会。
- 这次大会上 Windows 自己专属的那套(Windows Agent Runtime 等)还只是内测 / 预览,要等到 Windows 11 下半年的更新才陆续推出。
- 换句话说:没有一个叫"Windows AI 助手框架"的东西在这次大会正式落地。
「AI 不会改变你的业务,运行它的系统才会。」—— 微软 CEO 萨提亚·纳德拉,在 Build 2026 开场。他想说的是:光有一个聪明的 AI 没用,真正能改变工作的,是「让 AI 稳定干活的整套系统」——模型、它要懂的上下文、它能用的工具,缺一不可。
来源:Satya Nadella Opening Keynote(Microsoft Developer 官方) primary · 官方文字稿 primary · 精华版 Highlights · 全部 session 点播
01 模型层 · 最底下的「大脑」
微软自己造了 7 个 AI 模型
过去微软的 AI 很大程度上是转卖 OpenAI 的。这次,微软自己的 AI 团队(MAI,负责人 Mustafa Suleyman)一口气拿出 7 个自研模型,涵盖画图、语音、转写、推理、写代码。说白了:微软想把"AI 的大脑"攥在自己手里,不再处处看别人脸色。这是整套系统的地基。
- 官方以 "hill-climbing machine"(迭代式自我改进,而非一次性巨型发布)框定战略,跨 图像 / 语音 / 转录 / 思考 / 编码 五类。
- 完整七模型名单:MAI-Image-2.5、MAI-Image-2.5-Flash、MAI-Transcribe-1.5、MAI-Voice-2、MAI-Voice-2-Flash、MAI-Thinking-1、MAI-Code-1-Flash。
- ★ 首次向第三方分发权重:除 Foundry 外登陆 Open Router / Fireworks / Baseten,客户可"自行调权重"——减少对 OpenAI 依赖的重大信号。语音模型防克隆、全程水印;官方称 1.4× 性能/瓦 on Maia 200 ⚠ 未独立验证。
来源:Building a hill-climbing machine · MAI keynote 文字稿 primary
- 这是微软第一个主打"会思考、会写代码"的模型。官方称它在最难的编程评测里答对约一半(SWE-Bench Pro 53%),和顶尖模型 Opus 4.6 一个水平,数学竞赛题也几乎全对 ⚠ 都是微软自己测的。
- 不过它现在只小范围开放预览——而且微软自己两份材料一处说预览、一处说已正式可用,我们以更具体的那份(预览)为准。
来源:MAI keynote 文字稿 primary
- 写代码的 MAI-Code-1-Flash:体积很小(5B 参数),却号称编程评测答对一半(51%)、比同级更便宜 ⚠ 微软自测;已进 VS Code 等开发工具。
- 画图的 MAI-Image-2.5:官方称图像编辑排名第 2、超过谷歌 Nano Banana 2 ⚠,已经能在 PowerPoint 里用。转写的 MAI-Transcribe-1.5:支持 43 种语言、号称快 5 倍 ⚠。语音合成 MAI-Voice-2:15 种语言。
来源:Building a hill-climbing machine primary
用 AI 的人
多了几个能选的模型,尤其写代码的 MAI-Code 很小、便宜,适合塞进日常开发工具里。
做模型 / 工具的人
注意这条:微软第一次把自家模型权重放到 Fireworks、OpenRouter 等第三方平台——它在抢"模型分发"的地盘。
Azure 合作伙伴
手里多了"微软自研、成本可控"这张牌,但多数还在预览,别急着承诺客户上线时间。
02 运行时层 · 让 AI 真正「跑起来」的地方
Foundry:把 AI 助手送进生产的"工厂"
很多 AI 助手能演示、却不敢真上线,因为不稳、不安全、出了问题查不到。Foundry 就是微软给出的答案:一个能让 AI 助手稳定运行、还能监控和管控的"生产车间"。这是整场大会最实打实的产品核心。
- 它原来叫 Azure AI Foundry,这次升级成统一平台;上周刚把 OpenAI 的实时语音和 Claude Opus 4.8 也接了进来。
- "模型路由"(已正式可用)能按你的需求和预算自动挑最合适的模型——所以 Foundry 不绑死某一家,谁好用调谁;还能按需弹性分配 GPU 算力。
- 开源模型托管服务 Fireworks 也正式接入;官方称预览期已处理 1760 亿次调用、17 家世界 500 强在用 ⚠ 微软自测。
来源:What's new in Foundry · Foundry Models primary
- 每个 AI 助手都跑在独立的"隔离小房间"里(有专属算力、内存、文件空间,互不干扰),能撑住那种过夜长跑、自己干活的任务。
- 还能让 AI 助手像员工一样有"身份"——发工牌、给邮箱、出现在 Teams、排进组织架构;也能定时自动跑、或几个 AI 互相调用(都还在预览)。
- 给 AI 加了"记忆力":能记住做事的方法、记住你的偏好、记住当前对话(其中"方法记忆"官方称让任务成功率 +7~14% ⚠ 微软自测)。
- ⚠ 什么时候正式可用,微软自己两份材料说法打架(一处"30 天内"、一处"6 月底"),且官方文档 6/19 仍标"预览"。截至我们核对时还没正式发布。
来源:Build and run agents at scale with Foundry primary
用 AI 的人
想做"能自己干活、过夜跑任务"的 AI 助手,现在有了官方的托管环境,不用自己搭服务器。
做模型 / 工具的人
它"不挑框架"——LangGraph 等你也能接。但也意味着微软想当那个"所有人都来接入"的中枢。
Azure 合作伙伴
这是最能讲给客户的"可落地"故事;Model Router、Fireworks 已正式可用,托管 agent 还在赶 GA。
03 知识层 · 让 AI「懂你的事」
Microsoft IQ:喂给 AI 的四种"知识"
模型再聪明,也不知道你公司内部的事。微软用四个"IQ"把不同知识喂给 AI:Work IQ(你的邮件/会议/文件)、Fabric IQ(公司的业务逻辑)、Foundry IQ(可复用的知识库)、Web IQ(实时网页)。合起来,AI 才答得到点子上。
- "知识库"功能已正式可用,而且不限自家——Claude、ChatGPT 等也能直接接来用。它把"让 AI 查资料再回答"(业内叫 RAG)这套以前要自己搭的麻烦活,做成了开箱即用的服务。
- ⚠ 被广泛引用的 "+54% recall"需校正口径:指 "evidence recall";纯 knowledge base 只 +46%,+54% 需"小模型 + agentic retrieval"组合;基准 BrowseComp-Plus + 自家 gpt-5.4 ⚠ 厂商自测,"up to"为上界。
来源:Foundry IQ · +54% recall 评测原文 primary
- 捕捉工作如何真正发生(M365 邮件/会议/文件/Teams 信号),为所有 agent 提供共享智能层。
- Work IQ API(端点 GA 定于 2026-06-16)三面暴露:A2A、远程 MCP server、REST;10 个通用工具收敛数百操作,独立于 Copilot 许可、按用量计费。
来源:Work IQ + API primary
- 基于 Bing / Microsoft 网页索引(官方称已服务 10 亿+ 用户),跨 web / news / images / video / shopping 提供实时、带引用的 grounding;model-agnostic、MCP-native;官方称 sub-165ms · 零数据保留 ⚠。
来源:Announcing Microsoft Web IQ primary
用 AI 的人
AI 终于能"懂你公司的事"了——读你的邮件、文件、会议,回答才靠谱,不再是聪明的陌生人。
做模型 / 工具的人
微软把"喂数据给 AI"做成了标准服务(还兼容 Claude/ChatGPT 接入)——自建 RAG 的活儿被它收编了一部分。
Azure 合作伙伴
知识库已正式可用,是企业落地的关键卖点;但那个"+54%"要讲清楚是特定组合下的、官方自测数字。
04 应用层 · 你真正会用到的 AI
看得见摸得着的 AI 助手
前面几层都是底子,这一层才是你天天会打开的:Scout(帮你盯任务、备会的随身助手)、能在 Teams 里协作的 AI、以及给程序员派活的 GitHub Copilot 桌面应用。
- M365 中常驻个人 agent,主动浮现任务、准备会议、起草工作,跨 app/data 运作(Work IQ grounding)。
- 这是 Microsoft agent 平台最"看得见的脸"——把前面三层的能力收束成一个用户每天打开的入口。
来源:Introducing Microsoft Scout primary
- 协作 agent:在工作发生处(Teams / M365)做 multi-agent 编排,agent 间与人协调,基于 M365 Agents SDK。
- Frontier Tuning:通过 强化学习环境(RLEs)——官方称"AI 训练健身房"——在自有数据上定制 MAI 模型;官方称 Excel/McKinsey/Land O'Lakes 任务对标或超过 GPT-5.4/5.5 且省 10× ⚠。
来源:协作 agent · Frontier Tuning primary
- 全新桌面 app,agent-native:从桌面把编码任务委派给 agent;keynote 把 GitHub 定位为"所有 agent 的控制平面"。
来源:GitHub Copilot app primary
用 AI 的人
这是你真正会天天打开的东西:Scout 帮你盯任务、备会议、起草;开发者则多了个专门派活给 AI 的桌面工具。
做模型 / 工具的人
"Frontier Tuning"让企业能用自己的数据调出专属模型——定制化是这层的机会,也是竞争点。
Azure 合作伙伴
Scout、协作 agent 是最好讲给业务部门的故事;多为"已宣布",落地时间要跟客户说清楚。
05 操作系统层 · AI 住进你的电脑
Windows 给 AI 助手划一道"安全围栏"
如果 AI 助手要在你自己的电脑上跑,系统得先管住它——不能让它乱翻文件、乱动设置。Windows 这次就是在做这道"围栏"。提醒:这一层也是被媒体夸大最多的地方,多数还没真正落地。
- 为 OS 上运行的 agent 引入安全模型:作用域身份 / 权限 / 审计 / 隔离,agent 不能自由访问全系统。
- ⚠ 厘清两个被混淆的东西:达 GA 的是跨平台的 Microsoft Agent Framework (MAF)(.NET/Python SDK,2026-04-02 就 1.0 GA、先于 Build);Build 上的 Windows 专属 栈(Windows Agent Runtime / MXC / OpenClaw on Windows)是 alpha / preview,随 Windows 11 26H2(2026 下半年)推出。"Windows Agent Framework 已 GA"不成立。
来源:Windows platform security for AI agents · MAF(4/2 已 1.0 GA) primary
- Project Solara:面向 agent-first 设备的新平台,围绕"agent 作为主要执行者"重构设备/OS 栈——长周期愿景。
- Surface RTX Spark Dev Box:专用本地 AI 开发硬件,借 NVIDIA RTX 在本地跑模型/agent——云端 Foundry 的"本地对位"。MAI 模型也将"几个月内"登陆 Windows 上的 N1X。
来源:Project Solara · Surface RTX Spark Dev Box primary
用 AI 的人
未来 AI 助手能在你自己的电脑上跑,且被关进"安全笼子"——不能乱翻你的文件和系统。但这些大多要等 Windows 下半年更新。
做模型 / 工具的人
本地跑 AI 的硬件(Surface Spark)和设备平台(Project Solara)是新战场,但目前都还早。
Azure 合作伙伴
⚠ 这层最容易被媒体夸大——除了一道安全模型,专属栈基本是预览/愿景,别当成现成方案卖。
06 治理层 · 让老板敢用 AI
怎么管住 AI,让它能进公司
企业让 AI 干活,最怕的是"出错谁担责、会不会泄密、值不值这个钱"。这一层就是回答这些:给 AI 立规矩、全程留痕、能评估、算得清回报。而且微软把这套工具开源、还不绑自家平台——它想当行业的"安全标准"。
- ASSERT(已开源):帮你把公司的规矩翻译成"自动检查项",再拿这些项去考 AI、挑它的毛病。微软明说它不绑自家平台,是想给全行业的 AI 开发者用。
- ACS:一套给 AI 立规矩的通用标准——在 AI 干活的5 个关键环节(收到指令、调用模型、改状态、动用工具、输出结果)各设一道关卡,规则还能在不同平台之间搬。
来源:Open trust stack(ASSERT/ACS) primary
- Tracing & Evaluations 达 GA(6/3,基于 OpenTelemetry,支持 LangChain/LangGraph/OpenAI SDK/MAF),端到端追踪 prompt/模型/工具/子 agent。
- Foundry 内:Guided Guardrail Setup、Rubric Evaluator、Runtime DLP(均 Preview)、Purview Insights 达 GA;Agent Optimizer(私有预览→本月公开);ROI for Agents(私有预览)跟踪完成率/省时/成本。
来源:Observability to ROI primary
- 保护 code / agents / models(Defender + Entra Agent ID + Purview);每个 agent 有身份并受治理,含态势管理与 AI workload 威胁防护。
用 AI 的人
让 AI 进公司,老板最担心的是"出了错谁负责、会不会泄密"。这层就是回答这个——可追溯、能管控、算得清账。
做模型 / 工具的人
微软把这套(ASSERT、ACS)开源、且不绑自家平台——它想定行业的"安全标准",值得关注能否跟进。
Azure 合作伙伴
"安全可治理"是说服大企业的关键筹码,跨框架可观测已正式可用,可以直接讲。
07 数据与科学 · 已经在落地
连数据库都开始"为 AI 改造",科研已用上
主线之外还有个值得看的信号:连数据库都在为 AI 优化(更好地存记忆、做检索)。更实在的是 Microsoft Discovery——它是全场少数"已经正式可用"的,而且已经在帮 Mayo Clinic 做医疗科研,不只是演示。
- Fabric IQ 建模业务如何运作(语义/本体层,即 Microsoft IQ 的"业务"那条腿);GPU 加速 Fabric 数仓官方称 7× 性能 ⚠。
- Cosmos DB 加 agent memory toolkit / agentic retrieval / semantic reranking;Azure HorizonDB(托管 PostgreSQL):zone-redundant、自动故障转移、128TB/集群 · 15 读副本 · 3× 吞吐 ⚠。
来源:Agentic apps with Fabric & Databases primary
- 面向科研 R&D 的 agentic AI 平台达 GA(全场少数非 preview 公告之一),Discovery app 进入 preview。
- 用于 Mayo Clinic 前沿医疗 AI 合作(其平台称覆盖约 1 亿人/四大洲)——agentic AI 真正落到科学与医疗。
来源:Microsoft Discovery GA primary
用 AI 的人
连数据库都开始"为 AI 优化"了——存记忆、做检索更顺手。普通人更直观的信号是:Discovery 已经在帮医院做科研。
做模型 / 工具的人
数据层(Fabric、HorizonDB)是 AI 应用的底座,微软在这里也下重注,是上下游机会。
Azure 合作伙伴
Discovery 是全场少数"已正式可用"的,且有 Mayo Clinic 这样的标杆案例——最好拿去讲的成熟方案。
我们专门去挑了 5 个刺
为了不被宣传带节奏,我们专门反着来——挑 5 个最响亮的说法,逐个去查官方原文能不能站得住。结论:大方向是真的,但有些"亮点"经不起"是不是已经能用了"的追问——一个被直接证伪,其余多是"还在预览"或"厂商自己测的数字"。
"seven"被两个一手源逐字确认,但 = 5 基础 + 2 Flash 变体;"announced"准确,"launched / 已 GA"夸大。
开源模型是 Foundry 能力、不在 Copilot 产品里;"重建"是记者措辞;且这是 2026-03 的事、早于 Build。
两官方源时间冲突("next 30 days" vs "end of June"),Learn 6/19 仍标 preview。
达 GA 的是跨平台 MAF、且 4/2 就 GA;Windows 专属栈是 alpha / preview。
纯 knowledge base 只 +46%,+54% 需"小模型 + agentic retrieval"组合;厂商自测未独立验证。
✅ 一句话总结
我们想验证的那条主线是真的:Build 2026 的一堆公告,确实能串成一条从下到上的完整链子——模型 → 运行车间 → 知识 → 应用 → 操作系统 → 管控,而且每一环都能在微软官方原文里找到出处。纳德拉那句"光有聪明 AI 没用,要有让它干活的整套系统",就是这条链子的设计思路。
但别被热度冲昏头:这条链子里大部分还在"预览"阶段,不是马上能用(真正已正式可用的只有少数几个:Microsoft Discovery、Foundry 知识库、模型路由、跨框架监控);那些亮眼的数字(+54%、省 10 倍等)都是微软自己测的,没有第三方验证;还有两个流行说法被我们纠正了。蓝图很清晰,但能不能落地还得等。给你最实在的一句:愿景是"一整套 AI 助手基础设施",但今天真能押上去用的,还只是其中少数已经正式发布的部分。
📚 引用与来源(一手优先,完整清单见 sources.md)
Build 2026 官方新闻 hub(主索引) primary
MAI keynote 官方文字稿 · 7 个 MAI 模型 primary
What's new in Microsoft Foundry · Foundry Agent Service primary
Foundry IQ · +54% recall 评测 primary
Open trust stack(ASSERT/ACS) · MAF(4/2 已 1.0 GA) primary
Work IQ + API · Microsoft Web IQ primary
Microsoft Scout · GitHub Copilot app · Copilot 多模型(早于 Build) primary
Windows platform security for AI agents · Project Solara primary
Agentic apps with Fabric & Databases · Microsoft Discovery GA primary
Build 2026 Satya Nadella Opening Keynote(官方完整视频) · 官方 session 目录 primary
⚠️ 局限与存疑(research 诚实性)
- Foundry Agent Service / 托管 agent 是否如期 GA——"next 30 days" vs "end of June" 两官方源冲突,Learn 6/19 仍标 preview;需 7 月后回看兑现。
- MAI-Thinking-1 的真实状态——transcript 称私有预览、blog 概述称 GA,源内冲突未解。
- Windows 专属 agent 栈的成熟度与最终命名——随 Windows 11 26H2 推出,2026 下半年才见分晓。
- 所有厂商 benchmark(MAI 各项 / +54% recall / 省 10× / 7× 数仓 / 3× HorizonDB)无独立第三方复现,仅作"官方宣称"呈现。
- 配图中标 "© Microsoft" 者为官方素材外链引用(hero 主视觉、keynote 舞台照,均自 microsoft.ai,带来源标注,用于评论/研究);其余标 "42-research 绘制" 者为自绘 SVG 示意图(自包含、矢量、无外部依赖)。
- 官方 hub 共 70+ 公告,本课题聚焦 AI 主线约 25 条;非 AI-核心条目(Azure Cobalt 200 / Azure Linux 4.0 / 量子 Majorana 2 等)未纳入主体。