切换到宽版
  • 187阅读
  • 2回复

[数码讨论]刚刚,Windows「梦中神机」来了,把你的 PC 变成 Agent 工位 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
257909
金币
992322
道行
2006
原创
2475
奖券
3735
斑龄
47
道券
1645
获奖
0
座驾
设备
摄影级
在线时间: 53399(小时)
注册时间: 2008-10-01
最后登录: 2026-06-17
只看楼主 倒序阅读 楼主  发表于: 06-03
— 本帖被 兵马大元帅 执行加亮操作(2026-06-05) —

微软和 OpenAI 的蜜月期,曾经是整个 AI 行业最重要的联盟。

一方握着模型,另一方手握云服务、办公软件、开发者工具和企业客户, 双方互相成就,几乎让微软在 AI 时代提前拿到一张头等舱门票。但即便联盟再紧密,微软也不能永远把最关键的 AI 想象力寄托在别人身上。

尤其是在双方关系开始脱钩之后。

文章配图-1

刚刚召开的 Build 2026 因此变成一场特殊的发布会。微软比以往任何时候都需要一场酣畅淋漓的 AI 胜利, 向外界证明自己究竟是 AI 时代的主角,还是依旧只是 OpenAI 的云服务商?

从 MAI 模型、Azure AI Foundry、到量子计算以及本地智能体能力,再加上黄仁勋和龙虾之父的相继站台,微软展示了一整套覆盖开发、模型、数据、算力和治理的完整生态,其目标也很清晰: 将 AI 从 OpenAI 主导的模型红利,转变为微软主导的平台生意。

微软自研模型发布, MAI 补上 AI 供应链最关键一环

相比去年,微软这次把模型放在了更重要的位置。微软 CEO 纳德拉称,Microsoft Foundry 目前已有超过 11000 个模型,覆盖 OpenAI、Anthropic 和微软自研 MAI 模型。

微软的判断是,企业和开发者不会只依赖一个模型完成所有任务。不同任务会对应不同模型,也会受到延迟、成本和能力边界的约束。因此,模型目录、模型选择、运行环境和企业治理,会一起构成新的平台竞争点。

今天,微软自研模型家族正式一口气推出了七款新模型,覆盖推理、代码、图像、语音和转录等方向。

文章配图-1

MAI Thinking 1 是其中的推理模型。它采用稀疏 MoE 架构,35B active 参数,总参数规模约 1T,支持 256K token 上下文,足以容纳大约 600 页文档。

微软 AI 负责人穆斯塔法·苏莱曼强调,这个模型没有使用第三方模型蒸馏,训练数据来自干净且合规授权的数据,并在预训练中排除了 AI 生成内容。它已在 Microsoft Foundry 私有预览,之后会进入 MAI Playground 公测。

文章配图-1

代码模型 MAI Code 1 Flash 面向日常开发工作流。它由微软端到端训练,使用干净且合规授权的数据,正在向 Visual Studio Code 中的 GitHub Copilot 个人用户推出,入口包括模型选择器和默认自动选择器。

文章配图-2

微软称,这个模型针对 GitHub Copilot harness 做了训练和适配,支持 Agentic coding,也支持 adaptive thinking。简单请求保持简洁,复杂任务会投入更多推理预算。

微软把 MAI Code 1 Flash 直接拿来和 Claude Haiku 4.5 比较。

MAI Code 1 Flash 在 SWE Bench Pro 上达到 51.2%,高于 Claude Haiku 4.5 的 35.2%;在 IF Bench 精确指令跟随上领先 28.9 分,在 Advanced IF 上领先 14.5 分。它将支撑微软 GitHub Copilot 的常见编码场景,尤其是代码修改、多轮指令和真实开发环境里的 Agent 任务。

图像和语音模型也被纳入 MAI 体系。

MAI Image 2.5 和 Flash 版本支持文本生成图像和图像编辑,已经进入 PowerPoint,并会扩展到 OneDrive 和 Foundry。

文章配图-1

MAI Transcribe 1.5支持 43 种语言,微软称其速度达到竞品 5 倍,正在集成到 GitHub、Teams、Copilot 和 Dynamics 365 Contact Center。

文章配图-1

MAI Voice 2支持 15 种语言,可通过短样本适配声音,同时内置防滥用保护;低成本版本 MAI Voice 2 Flash 也在计划中。

文章配图-1

微软还把 MAI 模型和自己的芯片联系起来。MAI Thinking 1 已针对 Maia 200 优化,端到端运行 MAI 模型时,还能获得 1.4 倍每瓦性能提升。

文章配图-1

企业定制也是 MAI 模型的重要方向。未来所有企业不仅会调用模型,也会把自己的流程训练进模型。

为此,微软还发布了 Microsoft Frontier Tuning,核心是 reinforcement learning environments。企业可以把真实工作轨迹、任务步骤、决策、工具调用和评价标准变成训练环境,让模型学习组织内部的工作方式。

PC 变成 Agent 工位,你的桌面就是数据中心

除了模型,微软也把重点转向本地算力。

文章配图-1

Surface RTX Spark Dev Box 是这部分最值得一提的产品。纳德拉把它称为面向开发者的「dream machine(梦中神机)」。这台设备提供 1 petaflop AI 算力、20 个 CPU 核心和 128GB 统一内存,计划在今年秋季推出。

文章配图-1

Surface RTX Spark Dev Box 基于 Nvidia RTX Spark 平台。,把 CPU、GPU 和 AI 能力整合到一颗芯片中,并支持统一内存架构和集成 DRTM。

英伟达 CEO 黄仁勋在视频连线中表示,PC 正在从个人电脑走向个人 AI。他举例称:用户外出时,可以给自己的 PC 发消息,让本地 Agent 调用工具、修改代码、推进设计,再和用户继续迭代。

文章配图-1

PC 不再只是一个被人操作的工具,也开始变成可以持续运行任务的 AI 助手。

此外,微软还为 Surface RTX Spark Dev Box 预装开发优化的 Windows 11 Pro,内置 VS Code、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows 等工具。

文章配图-1

现场演示中,这台设备默认没有新闻流、组件弹窗和通知,使用深色模式; Windows Insider 版本还加入了纵向任务栏,不仅开发工具被进一步系统化,命令行和容器体验也更接近 Linux。

文章配图-1

硬件上,它采用阳极氧化铝 3D 打印一体机身,拥有 1000 个通风孔,热设计功耗 100W,接口包括 USB-C、USB-A、HDMI、以太网和耳机接口。

Windows 将在 AI 时代大有作为。本地 AI 要让 PC 成为 Agent 工作流的一部分:开发者可以在本地调试、运行模型、调用工具、看日志、开容器、跑子 Agent,再把更大规模任务交给云端。

Agent 需要新入口,微软探路下一代 AI 终端

相比 Surface RTX Spark Dev Box 面向开发者,Project Solara 更像微软对 Agent 设备形态的提前试探。 下一台计算机不会只是一台设备,而是一组协同工作的设备。

微软展示了两类参考设备。

第一类是固定在桌面上的工作终端,基于联发科芯片。

文章配图-1

文章配图-2

第二类是可佩戴数字工牌,使用 Qualcomm 可穿戴芯片,面向移动工作场景。

文章配图-1

演示中,用户通过指纹解锁后,要求 Copilot 为社交媒体帖子收集现场素材。工牌负责拍摄画面,Agent 负责挑选镜头、清理画面,并发送给本人和团队审阅。发布会还展示了医疗场景: 护士可用它进行免提语音记录、区分说话人、核验生命体征、扫描药物并验证护理流程。

文章配图-2

这两类设备只是参考形态。

手机和 PC 仍然重要,但一些工作场景需要更靠近人、空间和传感器的硬件。面对未来的 Agent 时代,企业可以更换 Agent,调整外观、屏幕、传感器和输入方式,在同一硬件和软件基础上适配不同垂直行业。

龙虾之父站台,微软给个人 Agent 加上企业护栏

Surface RTX Spark Dev Box 讲的是本地算力,Project Solara 讲的是新设备形态,OpenClaw on Windows 则把焦点转到 个人 Agent 如何安全进入企业。

文章配图-1

微软展示了适用于 OpenClaw 的 Windows 套件,可以帮助用户设置自己的 OpenClaw,或连接已经托管在 Windows 和 WSL 中的 OpenClaw。

文章配图-1

应用里可以查看 gateway、参与 OpenClaw 的其他机器、会话和使用情况,也能快速进入 chat、canvas 和主控制台。

安全演示围绕文件权限展开。

OpenClaw Windows Companion app 允许用户控制 Agent 能访问哪些文件夹,以及这些文件夹是只读、可写还是隐藏。它也可以配置剪贴板访问、联网权限等细粒度选项。

微软在现场要求 OpenClaw 删除桌面上的所有文件,并临时关闭 OpenClaw 自身的安全层,只保留 MXC 的系统级限制。 由于桌面文件夹被设置为只读,OpenClaw 多次尝试删除和检查目录,最后仍无法删除文件,桌面上的 94 张 JPG 得以保留。

文章配图-1

龙虾之父 Peter Steinberger 也透露,过去几个月 OpenClaw 与 Microsoft、GitHub、OpenAI、Nvidia 等团队合作,增加了可观测性、自动权限模式,并重新设计访问控制。 现在权限不再只有全部允许或全部禁止,用户可以指定哪些文件夹只读、哪些可写、哪些对 Agent 隐藏。

文章配图-1

他还宣布,OpenClaw 可以在公司内部运行,harness 本身已经插件化。企业可以接入自己信任的 Copilot、Codex 或其他系统,把已有规则带进 OpenClaw,再获得持续记忆、heartbeat,以及在 Slack 或 Teams 中使用 OpenClaw 的能力。

AI 下半场,微软盯上企业平台入口

除前述硬件和 Windows 更新外,微软还发布了更多产品。

开发工具方面, 微软发布新的 GitHub Copilot app。它更像一个 Agent 编码会话管理器,开发者可以同时启动多个 issue 会话,并用 Git worktree 隔离,让多个 Agent 并行工作。

Agent Merge则负责跟踪 PR 的 CI 检查、代码审查和合并冲突。微软还发布 Raven,这是一个 Agent first SDK,用于连接 backend as a service,处理身份、存储和数据库 schema 等后端问题。

上下文能力由 Web IQ承担。

Agent 要进入企业流程,需要连接网络新信息、企业业务对象、实时运营状态、人员关系和组织流程。Web IQ 负责外部网络信息,支持网页、新闻、图片和视频,模型无关、MCP native,可接入任意 Agent runtime,让 Agent 的回答建立在更新、可验证的内容上。

文章配图-1

Copilot 也在升级为更复杂的工作入口。

纳德拉称,今年夏天会把 chat、cowork 和 code 放入同一个 Copilot,并发布 Autopilots。首个 Autopilot 名为 Scout,面向 Copilot Frontier 用户开放,可在 Teams 群聊和 Outlook 线程中工作。

文章配图-1

企业治理层面,微软发布 Agent 365。它为 Agent 提供身份、权限、访问控制和合规管理,并接入 Entra、Defender 和 Purview。Agent 365 可管理托管在 Azure、AWS、GCP 或其他环境中的 Agent,也支持不同框架构建的 Agent。

科研方向则是 Microsoft Discovery。纳德拉把它定义为面向科学发现的 Agent 平台,希望把论文研究、候选方案生成、仿真计算、实验设计和自动化实验室连接成连续流程。

发布会最后,微软还正式发布了新一代量子芯片 Majorana 2,其量子比特平均寿命可达 20 秒,最高接近 1 分钟,比 Majorana 1 高约 1000 倍;操作时间为 1 微秒,尺寸仍为 0.01 毫米量级,并采用全数字控制。

文章配图-1

至此,这场拼图庞大且野心勃勃的发布会终于完整。 AI 的第一阶段,主导行业叙事的是模型公司;第二阶段,主导产业落地的可能是平台公司。

谁来选择模型,谁来分配任务,谁来管理 Agent,谁来定义权限和审计,谁就更接近企业 AI 的核心入口。当模型逐渐成为标准能力之后,真正决定价值归属的,将是承载这些模型运行的系统。

如果说当年那张 AI 时代的头等舱门票,很大程度上是借助盟友 OpenAI 的力量抢下的; 那么现在,微软已经坐进了驾驶舱,并打算亲自接管这架飞机的航向。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
257909
金币
992322
道行
2006
原创
2475
奖券
3735
斑龄
47
道券
1645
获奖
0
座驾
设备
摄影级
在线时间: 53399(小时)
注册时间: 2008-10-01
最后登录: 2026-06-17
只看该作者 沙发  发表于: 06-03
Build2026全面脱钩OpenAI:微软自建全栈AI生态,从云服务商转型AI平台掌舵者
曾经依靠与OpenAI深度绑定、借GPT红利一跃站在AI浪潮前排的微软,伴随双方合作逐步解绑,2026 Build开发者大会成为微软去OpenAI化的标志性节点。整场发布会从自研MAI全系列大模型、本地AI硬件、Windows智能体管控、企业Agent治理到新一代量子芯片全线落地,完成「依附外部模型→自研软硬件全闭环→掌控AI平台规则」的战略跃迁,目标把AI行业从单一模型驱动,改写为微软主导的平台化商业格局。

一、七大MAI自研模型落地,补齐AI供应链最核心短板
过往Azure生态高度依赖OpenAI、Anthropic等第三方模型,本次微软一次性推出7款MAI全品类自研模型,覆盖通用推理、代码、图像、语音全赛道,全部原生适配自研Maia 200芯片,摆脱CUDA与外部模型绑定。
1. MAI Thinking 1(通用推理):稀疏MoE架构,总参1T、有效激活参数35B,256K上下文可装载600页文档;无第三方模型蒸馏、训练数据源合规无AI生成内容,私有预览后接入MAI体验平台。
2. MAI Code 1 Flash(代码专用):深度适配GitHub Copilot,SWE Bench Pro得分51.2%,大幅超越Claude Haiku 4.5的35.2%;支持智能分预算推理,复杂任务加码算力、简易请求精简运算,直接内嵌VS Code Copilot模型选择面板。
3. 多媒体产品线:MAI Image 2.5接入PowerPoint、OneDrive实现AI生图修图;MAI Transcribe 1.5覆盖43国语言,处理速度为行业竞品5倍,落地Teams、GitHub、企业客服系统;MAI Voice 2支持小样本音色复刻,同步规划低成本Flash轻量化版本。
4. 软硬件协同优化:MAI全系列针对Maia 200加速芯片定制,同硬件环境下单瓦算力提升1.4倍。
5. 企业定制能力:Frontier Tuning:依托强化学习环境,企业可录入自身业务流程、决策逻辑、工具调用规则,在原生框架下微调专属行业模型,打通通用大模型落地企业的最后一环。

依托上述自研矩阵,Azure AI Foundry现已聚合11000+模型,形成「自研MAI+第三方主流模型」混合选型池,企业按需自选模型、算力、部署方案,微软牢牢握住模型分发与运维话语权。

二、两条硬件路线落地:PC变本地算力节点+新型Agent终端破圈
微软从云端算力下沉终端,拆分开发者专业硬件+行业参考硬件两条路线,落地「云端大算力+本地小Agent」分布式架构。
1、Surface RTX Spark Dev Box(开发者主机)
被纳德拉称作AI开发神机,搭载整合CPU/GPU/AI单元的RTX Spark一体化芯片,1Pflop AI算力、20核CPU+128GB统一内存,秋季正式上市;整机3D打印铝制机身、百孔散热,预装精简版Win11 Pro,全套VS Code、WSL、Copilot开发环境,系统砍掉冗余推送与弹窗。
黄仁勋现场连线佐证产品逻辑:PC进化为个人AI算力终端,用户远程下发指令,本地常驻Agent自主完成编程、设计、文档处理,本地调试小模型、繁重任务上云,形成云边协同。

2、Project Solara行业硬件参考方案
推出双形态Agent硬件:联发科方案桌面固定终端、高通可穿戴工牌,聚焦实体办公场景。演示中工牌集成拍摄、拾音、扫码,护士免提录病历、职场人自动采编社交素材;硬件标准化、软件模块化,企业按需更换Agent与传感器,快速落地医疗、制造、行政等垂直场景。

三、OpenClaw登陆Windows,微软筑牢企业Agent安全护城河
本次发布会引入OpenClaw生态落地Windows,借「龙虾之父」Peter Steinberger背书,补齐个人Agent商用化最关键的权限管控短板,也是微软切入企业Agent安全治理的关键布局。
1. 细粒度权限隔离:Windows配套OpenClaw管控APP,可单独设置Agent对文件夹「只读/可写/隐藏」,同时管控剪贴板、联网权限;现场实测:即便关闭Agent自身安全防护,依托系统底层MXC限制,Agent无法删除桌面受保护文件。
2. 企业私有化部署:OpenClaw支持企业内网部署,插件化架构可对接自有Copilot、业务系统,搭配长期记忆、心跳监测,无缝接入Teams、Slack办公生态。
自此微软解决行业痛点:个人智能体自由灵活,但企业忌惮数据泄密不敢落地,靠系统级权限管控打通C端Agent走向B端商业化的壁垒。

四、全链路Agent工具矩阵成型,抢占企业AI治理入口
围绕Agent全生命周期,微软一次性上线多款配套SDK与管理产品,从开发、调试、部署、治理全链条锁死企业需求:
- GitHub新Copilot APP:多会话并行编码,Git Worktree隔离项目,Agent Merge自动处理PR审核、冲突合并;
- Raven(Agent优先SDK):简化后端部署,一站式搞定身份、数据库、存储配置;Web IQ独立负责实时外网资讯接入,模型无关可对接任意智能体;
- Agent 365:跨云Agent统一管控平台,兼容Azure/AWS/GCP多环境智能体,联动Entra身份、Defender安全、Purview合规,实现全平台Agent权限审计;
- Copilot Autopilots:夏季整合聊天、协作、代码三大能力,首发Scout,在Outlook、Teams内自动处理群组事务。

除此之外,科研侧发布Microsoft Discovery科研Agent平台,串联文献查阅、仿真实验、自动化实验室;硬件底层亮出第二代Majorana拓扑量子芯片,量子比特寿命较前代提升近千倍,夯实远期底层算力储备。

五、战略总结:AI从模型竞争转向平台规则之争
AI上半场,GPT定义行业标准,微软借OpenAI拿到AI入场券;进入产业落地阶段,平台生态成为胜负手:谁掌握模型分发、Agent管控、算力调度、合规标准,谁就掌握AI商业话语权。

微软通过Build2026完成全栈闭环:自研MAI摆脱外部模型依赖、终端硬件落地云边一体、Windows+OpenClaw锁定Agent安全规范、Azure Foundry聚合全行业模型资源。
从依附OpenAI的云服务商,变成自主掌控软硬件、终端、治理规则的平台制定者,微软正式接管自身AI发展航向。
如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
188661
金币
692609
道行
20100
原创
769
奖券
545
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 24002(小时)
注册时间: 2012-06-21
最后登录: 2026-06-17
只看该作者 板凳  发表于: 06-03
Windows「梦中神机」:PC进化为AI Agent工位的核心升级
微软在Build2026大会上发布的Surface RTX Spark Dev Box,被纳德拉称为面向开发者的「梦中神机(dream machine)」,核心目标是将PC从“被动操作工具”升级为“主动运行的AI Agent工位”,以下是关键信息梳理:

一、核心硬件:本地AI算力的“性能怪兽”
算力规格:基于英伟达RTX Spark平台打造,提供1 petaflop AI算力、20个CPU核心、128GB统一内存,热设计功耗100W,计划2026年秋季推出

开发生态预装:内置VSCode、WSL、PowerShell 7、GitHub Copilot、Coreutils for Windows等开发者核心工具,支持本地调试、模型运行、工具调用、容器部署,甚至可运行子Agent,再将大规模任务同步至云端

硬件设计:阳极氧化铝3D打印一体机身,配备1000个通风孔保障散热,接口覆盖USB-C、USB-A、HDMI、以太网、耳机接口,适配多场景开发需求

二、AI Agent生态:从“工具”到“工位”的范式升级
微软同步推出7款自研MAI模型,覆盖推理、代码、图像、语音、转录等方向,与“梦中神机”形成“本地算力+云端模型”的完整AI Agent生态:

MAI Code 1 Flash:专为开发者打造的代码模型,适配GitHub Copilot,支持Agentic Coding(智能体编码)和Adaptive Thinking(自适应推理),可独立完成代码修改、多轮指令执行等复杂开发任务

MAI Transcribe 1.5:支持43种语言的语音转录,速度达竞品5倍,已集成至GitHub、Teams、Dynamics 365 Contact Center等工具,实现会议、文档的实时AI转写

MAI Image 2.5:支持文本生成图像、图像编辑,已接入PowerPoint,后续将扩展至OneDrive、Foundry平台,赋能办公场景的AI视觉创作

三、行业意义:PC进入“个人AI”时代
英伟达CEO黄仁勋在Build2026上强调,PC正从“个人电脑”进化为“个人AI”:不再只是用户被动操作的工具,而是能持续运行任务、自主决策的AI助手。微软通过“梦中神机”+MAI模型的组合,构建了“本地调试+云端协作”的AI Agent工作流,让开发者能在本地完成模型训练、任务调试,再对接云端大规模算力,真正实现“桌面即数据中心”


补充:Windows生态中的AI Agent技术背景
除了微软官方发布的“梦中神机”,Windows生态中还存在开源AI Agent工具(如Windows-Use),通过LLM决策引擎、GUI工具集、桌面状态感知等技术,实现自动化操作Windows界面(如启动应用、窗口管理、任务执行),为“PC变Agent工位”提供了技术验证路径
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个