切换到宽版
  • 11阅读
  • 2回复

[数码讨论]手机厂靠拢豆包 [复制链接]

上一主题 下一主题
在线jjybzxw

UID: 551814

 

发帖
213254
金币
620563
道行
2006
原创
2441
奖券
3260
斑龄
41
道券
1197
获奖
0
座驾
设备
摄影级
在线时间: 46590(小时)
注册时间: 2008-10-01
最后登录: 2025-12-23
只看楼主 倒序阅读 使用道具 楼主  发表于: 6小时前

来源:字母榜

努比亚 M153 的三万台还没有卖光,豆包的手机端合作版图,有望进一步扩大。

近日,界面新闻报道称,字节跳动正推进与 vivo、联想、传音等硬件厂商开展 AI 手机合作,为其设备预装 AIGC 插件;多位 vivo 员工向媒体证实双方已确认合作、正在讨论细节。

不过,仅凭这条消息模糊的表述,尚无法确认这些“合作”的具体性质,是否和此前字节与中兴的合作方案划等号。此前,在 nubia M153 上,字节在手机 OS 层深度构建了 GUI Agent,可以自动接管用户指定的跨 App 操作,但随后遭受了来自微信、淘宝等 App 的“反制”。

但从最新合作传闻中不难看出,M153 的尝试还是吸引了手机行业的目光。随着字节带着豆包大模型能力入局,终端厂商的原生 AI 生态正在加速扩张。

这一趋势,在近日举办的火山引擎 FORCE 原动力大会上可以窥探一斑。

包括中兴、荣耀、小米、vivo 在内的多家手机厂商为火山引擎“站台”。不过,除 nubia 带来的 M153 之外,大部分手机厂商和豆包的关系更多是模型能力的调用,Agent 层面的产品形态、交互方式以及系统级整合,依然主要由手机厂商主导。

在本届源动力大会的群访环节,火山引擎总裁谭待在接受直面 AI 采访时表示,“AI 的价值在于用更方便、更便利的方式,做大用户的需求”。

显然,不管后续字节和这些厂商的合作如何展开,一个行业趋势已经愈发清晰。系统层的 Agent 潜力巨大,即便当前落地存在一些阻力,但在 M153 上已经能看到未来的雏形。

不管是合作还是自研,大模型厂商和手机厂商们,已经喊着“做大做强”的口号,加速涌入这一赛道。

手机厂商们加速拥抱字节等大模型厂商,背后是手机端原生助手领域,有着天然体量巨大的活跃用户基础。

QuestMobile 的 2025 年三季度报告显示,截至 2025 年 9 月,移动端 AI 应用 MAU 达到 7.29 亿;其中“手机厂商 AI 助手”规模约 5.35 亿,“原生 AI App”约 2.87 亿,“In-App AI”约 7.06 亿。

换言之,在原生 AI 的不同形态里,终端和 App 有着明显的用户“层级差”:原生 AI App 依赖用户主动点击触发,而系统级助手天然就在“随手就用”的前置位,甚至无需用户刻意点击就能维持日活。

事实上,围绕“如何在系统层唤起 AI、如何让助手不只停留在语音问答”的探索,几乎已经成为国内主流手机厂商的共识,只是受限于模型能力与工程稳定性,多数方案最终停留在“增强版语音助手”的阶段,而豆包手机助手的出现直接踢开了这扇大门。

尽管nubia M153呈现的效果在业内仍有争议,但豆包手机助手在 OS 层获得授权后,实现了自动接管用户的跨应用任务,让业内看到了完全体 GUI Agent 的雏形。这一形态带来的想象力空间,并不会随着部分超级 App 的“反制”而消失。

另一方面,随着近两年大模型在指令理解、多轮规划与工具调用能力上的明显跃迁,AI 首次具备了承担复杂任务链的可能;与此同时,移动端算力、内存与本地推理能力的持续提升,也让“端侧执行”不再只是概念。

手机端“可跑得动”的关键之一,是移动 SoC 的 NPU 峰值算力与能效在近两代出现跃升。根据行业调研机构 Counterpoint 的分析,2025 年全球主流旗舰级 SoC 几乎全面支持生成式 AI,本年度出货的高端 SoC 中有约 88% 已具备生成式 AI 能力,且这些芯片的 AI 算力峰值在 2025 年已经接近 100 TOPS级别,约为 2021 年水平的四倍。

AI登“机”的浪潮下,Siri 时代那种以固定指令为主的语音助手逻辑,已经难以满足用户对“智能”的期待。

在这样的窗口期下,手机厂商迫切需要在硬件与系统层面,寻找新的体验突破口;而 AI 云厂商,则拥有更成熟的模型与工程能力。双方的靠拢,并非一次偶然的商业试探,而是技术成熟度与产业需求叠加后的结果。

这也是为什么,尽管 M153 的销量规模有限,但 3 万台工程机,仍像是一枚信号弹,给早已蠢蠢欲动的手机行业一个冲锋的信号。

这样的背景下,市场开始传出 vivo 等体量更大的厂商,与字节推进合作的消息,其实合情合理。这并不意味着所有厂商都会复制 M153 的深度定制模式。vivo 此前就发布过“蓝心智能”AI 战略与自研蓝心大模型矩阵,并强调 OriginOS 与系统级智能体能力的升级。

另一边,以荣耀为例,YOYO Agent 已接入豆包大模型的部分能力,但 Agent 的训练、产品逻辑与系统整合,依然由荣耀主导完成。这种“能力接入而非产品外包”的方式,或许才是更多手机厂商在当前阶段的现实选择。

值得关注的是,荣耀首席影像工程师罗巍,此前曾就豆包手机助手发表个人观点:“因为字节没有硬件研发能力,或者硬件能力并不比中兴领先。那么就是两个矮子在一起,也不会生个高子。”

但在这番评价之后,荣耀的展台仍然作为火山引擎合作伙伴,出现在了本届原动力大会上。

回过头看,字节的这次激进,并不是脱离产业节奏的冒进,而是踩在一个已经逐渐成熟的窗口期上。M153的意义,也并不在于证明某一款产品的成功,而在于让行业更坚定地看到:端侧Agent,已经成为一条无法回避的路径。

而面对微信和淘宝等App不断筑高的城墙,App与Agent的关系,成了绕不开的下一问。

豆包手机助手面世以来,在业内迅速引发了一些讨论:当 AI 可以直接理解意图并代为操作,Agent 是传统 App 的威胁吗?

在本届火山引擎原动力大会的群访环节,谭待回应了直面AI提出的这一问题,他首先从用户视角进行了阐述。

“假如说用户想点一杯咖啡,点咖啡这个操作不管是通过跟机器人语音交互,还是操作手机完成,最后都是为了满足用户的需求。”在他看来,普通人还有很多需求没有被满足,通过 AI 可以更好地解决这些问题。

“至于这个 AI 的载体是 Web、App、agent,还是套了个 App 壳的 agent,可能没有那么大关系。”谭待这样说道。

所以,回到手机原生助手层面,能操作多少 App 也许从来不是问题的核心,真正重要的,是 AI 是否能用更低的使用成本,把原本未被满足的需求释放出来。当需求被“做大”,无疑在硬件层面可以建立起全新的用户心智,尤其是广大用户对 AI 已经并不陌生的 2025 年。

QuestMobile 数据显示,截至 2025 年第一季度,原生 AI 应用的月活跃用户规模大幅扩容,其中用户对 AI 原生应用从“尝鲜”逐渐转向“依赖”,其人均月使用次数同比增速明显高于使用时长增速。

报告显示,AI 原生应用的月人均使用次数同比增长约 53.1%,而月人均使用时长则增长约 32.7%,用户层面倾向于多次短时打开 AI 应用去完成即时类需求。

这些需求,正是手机原生 Agent 可以放大的那部分。但这本质上是一个增量逻辑,并不意味着 App 的价值短期内会被快速削弱。

中国信通院在 2024 年发布的数字应用生态报告指出,用户使用时长仍高度集中在少数头部 App 上,支付、即时通讯、短视频等核心应用合计占据超过八成的用户总使用时长。这些 App 所承载的账户体系、支付能力、内容供给与安全责任,短期内都不具备被 Agent 直接替代的条件。

也就是说,Agent 正在改变 App 的“入口位置”,而非消解其存在价值。

在这一结构中,App 仍然是能力与服务的封装体,但不再必然是用户表达需求的起点;Agent 则逐渐承担起“需求调度层”的角色,负责理解意图、拆解任务,并将执行分发给不同应用或系统能力。

甚至,用户驱动 Agent 的终端甚至未必是手机。

根据 Counterpoint Research 的追踪与分析数据,2025 年智能可穿戴设备市场中 AI 智能眼镜等具备本地 AI 能力的终端表现出显著增长势头。2025 年上半年,全球智能眼镜出货量同比增长超过 110%,其中 AI 型智能眼镜的出货占比大幅提升,反映出业界对本地 AI 能力的快速采纳趋势。

而在这一背景下,字节也不会是唯一入场的大模型厂商。

智谱 AI 在近期将其核心 AI Agent 模型 AutoGLM 开源,使研究者与开发者能够基于该模型构建具备“Phone Use”能力的 AI 终端智能体。

AutoGLM 能够理解屏幕内容,并通过模拟用户操作(如点击、滑动、文字输入等)完成多步骤任务流程,目前已在微信、淘宝、抖音、美团等超过 50 个高频中文应用场景中展示出自动化操作的能力。

换言之,当更多大模型厂商试图“上机”,分水岭就不再只是模型接入,而是手机厂商是否愿意把系统层的 AI 入口与规则让渡出去。下一阶段的竞争,更像是“系统与生态”的较量。

如果说 nubia M153 更像是一种“工程验证”,那么在它发布数周后,小米在人车家全生态大会上同步披露的澎湃 OS 与 AI 进展,则代表着传统手机豪强的同步跟进。

在这场大会上,小米并未将重心放在单一模型或功能上,而是反复强调澎湃 OS 作为系统级底座的角色——它正在成为连接手机、平板、电视等多终端的统一操作系统框架,也是 AI 能力被组织、分发与约束的核心层级。

这一判断,并非停留在概念层面。根据小米官方披露的数据,截至 2024 年底,小米 AIoT 平台已连接设备数超过 8.2 亿台,覆盖手机、平板、电视、穿戴与家居等多个品类。澎湃 OS 的目标,正是将这些分散设备纳入统一系统框架之中,使 AI 能力可以在不同终端间被调度与复用,而非依附于单一应用。

这意味着,在小米选择把 AI 能力牢牢放在操作系统内部,而且这个系统对应的硬件生态同样庞大。

另一边,作为小米 MiMo 大模型相关负责人,罗福莉在本次大会上首次公开亮相。在谈及 AI 能力演进方向时,她将重点放在任务理解与执行层面,强调 AI 需要具备对复杂需求进行拆解、规划并与系统能力协同完成的能力,而不仅停留在单轮问答或信息生成阶段。

从产业结构看,这条路线与字节所代表的 AI 云厂商路径形成了对照。

头部 AI 厂商希望进入手机 Agent 市场,逻辑并不复杂,是因为手机仍是用户最重要、最稳定的高频入口之一;但对手机厂商而言,操作系统、硬件整合与生态控制力,才是其长期优势所在。一旦 Agent 深度嵌入系统层,谁来定义交互方式、权限边界与默认入口,决定了最终的主导权。

这也是为什么,多数头部手机厂商在接入外部模型能力的同时,仍坚持自研 Agent 框架与系统级助手。它们更倾向于把云厂商视为能力提供者,而非产品定义者。

事实上,这并非一条新出现的路径。更早之前,华为在推进 HarmonyOS 与小艺助手的过程中,已经持续强化系统级调度与跨设备协同能力,并将 AI 能力作为操作系统的一部分加以演进。

根据华为在 2024 年开发者大会上的公开数据,HarmonyOS 生态已覆盖 8 亿+ 设备,注册开发者超过 220 万,并运行在手机、平板、穿戴、车机及各类 IoT 终端之上。在这一体系中,小艺并非独立应用,而是深度参与系统级调度与跨设备协同,用于统一调用多终端能力。

而在智能眼镜、耳机等新硬件形态上,这种生态差异被进一步放大。对屏幕受限、操作碎片化的设备而言,Agent 更接近“基础交互层”,而品牌与系统协同能力,往往比单一模型能力更重要。

在这一点上,显然传统硬件厂商的优势会更大,但AI厂商们,如字节和阿里也在推进各自的AI硬件业务,小艺与超级小爱,是否能够在端侧体验上全面超越豆包,目前仍难下定论。

但近期手机圈对于豆包和其他AI的“加码”已经清楚表明,无论是 AI 厂商还是手机厂商,都已将目光投向 AI 手机这一仍待开垦的系统级空间。

在豆包手机助手的“信号弹”作用下,2026年,AI手机有可能迎来“做大做强”的一年。

山庄提示: 道行不够,道券不够?---☆点此充值☆
 
在线jjybzxw

UID: 551814


发帖
213254
金币
620563
道行
2006
原创
2441
奖券
3260
斑龄
41
道券
1197
获奖
0
座驾
设备
摄影级
在线时间: 46590(小时)
注册时间: 2008-10-01
最后登录: 2025-12-23
只看该作者 沙发  发表于: 6小时前
AI登“机”时代:系统级Agent的崛起与手机生态的重构
一、引言:从M153到行业共振——一枚信号弹点燃的AI终端革命

2025年,智能手机市场正经历一场静默却深刻的变革。尽管努比亚(nubia)M153仅售出三万台工程机,其商业表现看似平平,但它所承载的技术实验却如一颗投入湖心的石子,激起了整个行业的涟漪。

这款搭载豆包大模型深度集成GUI Agent的设备,首次实现了在操作系统层面对跨App任务的自动接管——用户只需一句话:“帮我订一张明天上午去上海的高铁票并发送行程给同事”,手机便能自主打开铁路12306、完成登录购票、跳转微信发送消息,全程无需人工干预。

这一能力虽遭部分超级App“反制”,但在技术路径上已清晰勾勒出未来智能终端的雏形:一个真正意义上的系统级AI代理(System-Level Agent)正在诞生。

而更深远的意义在于,它成为了一枚“信号弹”——宣告了AI从云端走向端侧、从工具应用升维为操作系统核心组件的时代正式开启。
二、产业图景:大模型厂商与手机厂商的双向奔赴
1. 合作模式分化:深度定制 vs 能力接入

当前,AI与手机硬件的融合呈现出两种主流路径:
字节跳动 × 中兴(nubia M153):深度耦合式合作
在OS层面构建专属Agent框架;
实现对UI元素的理解与自动化操作;
构成真正意义上的“可执行AI”。
荣耀YOYO Agent × 豆包 / vivo蓝心智能 × 外部模型:能力调用式整合
手机厂商主导产品定义与系统架构;
引入第三方大模型提升语义理解与任务规划能力;
保持对交互逻辑、权限控制和入口主导权的掌控。

这种差异背后,是双方战略诉求的根本不同:

| 角色 | 核心诉求 | 战略目标 |
|------|--------|---------|
| 大模型厂商(如字节、智谱) | 扩展AI落地场景,抢占用户入口 | 将AI能力前置化、系统化,形成“默认AI”心智 |
| 手机厂商(如小米、华为、vivo) | 巩固操作系统控制力,强化生态壁垒 | 构建统一调度中枢,实现多设备协同下的智能体验 |

因此,未来的合作不会是简单的“预装插件”,而是围绕系统权限、交互范式、服务分发机制展开的深层次博弈。
2. 技术成熟度支撑:端侧AI已具备落地条件

过去几年阻碍系统级Agent普及的关键瓶颈,如今已被逐一突破:
(1)算力跃迁:NPU推动本地推理成为现实
2025年旗舰SoC平均AI算力接近100 TOPS,较2021年提升约4倍;
高通骁龙8 Gen4、联发科天玑9400、苹果A18均全面优化生成式AI推理效率;
端侧运行7B~13B参数级别模型已成为常态。
(2)模型进化:指令理解与任务规划能力显著增强
大模型在多轮对话建模、上下文记忆、工具调用链编排方面进步明显;
AutoGLM、豆包Agent等已能在50+高频中文App中完成复杂任务流;
支持“观察-决策-执行-反馈”的闭环流程。
(3)工程稳定性提升:GUI Agent进入可用阶段
屏幕内容解析(OCR + UI Layout识别)准确率超过90%;
自动化点击、滑动、输入操作成功率大幅提升;
异常处理机制逐步完善,降低误操作风险。

这些进展共同构成了系统级Agent从“演示Demo”走向“日常可用”的基础前提。
三、用户需求变迁:从“尝鲜”到“依赖”,AI使用行为发生结构性转变

根据QuestMobile《2025年Q3数字应用生态报告》显示:

原生AI应用月活跃用户达7.29亿,其中:
手机厂商AI助手:5.35亿
原生AI App:2.87亿
In-App AI功能:7.06亿

更为关键的是使用行为的变化趋势:

| 指标 | 同比增速 |
|------|----------|
| 人均月使用次数 | ↑53.1% |
| 人均月使用时长 | ↑32.7% |

这表明:用户正从“长时间探索型使用”转向“高频短时触发型使用”,即AI逐渐演变为一种“即时需求响应工具”,而非独立的信息消费平台。

而这正是系统级Agent的核心优势所在:
无需主动打开App,通过语音或快捷手势即可唤醒;
不依赖特定界面入口,可在任何场景下被调起;
支持连续意图表达,例如:“把刚才那张图发给小王,再问他晚上吃什么”。

这类“轻量但高频”的需求,恰恰构成了用户生活中最密集的交互节点,也成为AI真正渗透日常生活的突破口。
四、生态博弈:App、Agent与操作系统的权力再分配
1. Agent不是App的替代者,而是“需求前置层”

一个根本性误解是:AI Agent会取代微信、淘宝、美团等超级App。事实恰恰相反——它们的关系应理解为:

App = 服务能力容器  
Agent = 需求调度中枢

当用户说“我想吃火锅”,Agent并不会自己去做饭,而是调用微信查看好友列表、打开美团筛选附近店铺、启动高德导航规划路线,并最终通过短信或电话完成预订。

在这个过程中,所有服务仍由原有App提供,但用户表达需求的方式发生了根本变化:不再是“先想用哪个App”,而是“直接说出我要什么”。

这意味着:
App的功能性价值依然稳固;
但其入口价值被削弱;
用户注意力开始向Agent转移,形成新的“心智入口”。

正如火山引擎总裁谭待所言:“载体不重要,满足需求才重要。”
2. 权限之争:谁来定义Agent的操作边界?

然而,当Agent试图自动操作App时,立即面临来自平台方的阻力。典型案例如:
微信屏蔽自动化登录检测;
淘宝限制非官方SDK的页面抓取;
支付宝关闭外部调用支付接口。

这本质上是一场关于数据主权与用户体验控制权的争夺战。

短期内,超级App仍可通过技术手段构筑“护城河”。但长期来看,开放与否将取决于两个变量:

1. 监管导向:若国家推动“互联互通”政策延伸至AI层,则封闭策略难以为继;
2. 用户体验倒逼:若用户普遍偏好Agent带来的便捷性,平台或将被迫让渡部分权限以换取留存。

参考欧盟《数字市场法案》(DMA)要求“守门人平台”必须允许第三方互操作,类似的规则未来也可能在中国出现。
五、未来展望:AI原生终端的三种可能形态

站在2025年的节点回望,我们或许正处于一个新时代的起点。未来几年,AI手机的发展可能沿着三条路径演化:
1. 超级OS路径:以小米澎湃OS、华为HarmonyOS为代表
将AI深度嵌入操作系统底层;
构建跨终端统一调度中枢;
实现“手机-平板-车机-家居”无缝协同;
典型案例:小米MiMo大模型 + 澎湃OS + AIoT生态(8.2亿设备连接)

✅ 优势:系统控制力强、生态协同性高  
❌ 挑战:需持续投入自研模型能力,追赶头部云厂
2. 开放平台路径:以字节豆包+硬件联盟为代表
提供标准化Agent SDK,赋能多个品牌;
推动“预装即默认”的规模化扩张;
借助内容生态(抖音、今日头条)反哺AI训练;
目标:打造“Android之外的第二AI层”

✅ 优势:模型能力强、迭代速度快  
❌ 挑战:缺乏硬件话语权,依赖厂商配合
3. 新终端路径:AI眼镜、耳机等无屏设备崛起
根据Counterpoint数据,2025上半年全球AI智能眼镜出货量同比增长超110%;
无屏环境下,GUI Agent成为唯一可行交互方式;
用户通过语音发起请求,Agent自主调用手机或其他设备执行;
成为检验“真Agent”能力的最佳试验场

✅ 优势:摆脱传统App界面束缚,重构人机交互  
❌ 挑战:续航、隐私、佩戴舒适度仍待突破
结语:2026,AI手机的“做大做强”之年?

回到最初的问题:为什么vivo、联想、传音等厂商纷纷传出与字节合作的消息?

答案并不在于M153卖了多少台,而在于它证明了一个方向的可行性——系统级Agent可以成为下一代人机交互的核心枢纽。

即便当前存在技术障碍、生态摩擦与商业模式模糊,但趋势已然不可逆:
用户渴望更低的认知负担;
厂商需要新的差异化卖点;
大模型亟需落地场景验证价值;
新终端呼唤全新的交互范式。

在这股浪潮之下,无论是坚持自研的小米与华为,还是选择开放合作的荣耀与vivo,亦或是奋力挤进赛道的字节与智谱AI,都在用自己的方式回答同一个问题:

谁,将成为你手机里那个“默认的AI”?

2026年,这场关于入口、权限与心智的战争,或将全面爆发。而胜利者,未必是技术最强的那个,而是最懂用户、最会整合、最敢重构生态的那个。

那时我们会发现,真正的AI手机,从来不只是“能聊天的手机”,而是一部会思考、能行动、懂你的数字生命体。
参考资料:QuestMobile《2025Q3 AI应用生态报告》、Counterpoint Research、中国信通院《数字应用生态白皮书》、火山引擎FORCE原动力大会公开资料
如何不发帖就快速得到金币道行
 
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊

发帖
297471
金币
39984
道行
40006
原创
109
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36914(小时)
注册时间: 2012-09-03
最后登录: 2025-12-23
只看该作者 板凳  发表于: 3小时前
📌 背景
2025年底,字节跳动旗下的豆包AI助手通过与中兴、努比亚等厂商合作,推出具备跨应用操作能力的AI手机,成为行业热议焦点。尽管初期产品如努比亚M153仅限量发售三万台,但其系统级AI助手的能力,引发了手机厂商和技术圈的广泛关注。

📊 当前手机厂商与豆包合作模式对比表
厂商    合作方式    系统整合程度    AI助手命名    特点
中兴努比亚    深度定制    系统级Agent    豆包手机助手    可跨应用操作,但受微信、淘宝等App限制7
荣耀    调用豆包模型    由YOYOAgent主导    YOYO + 豆包    AI助手训练、整合仍由荣耀主导1
小米    模型调用为主    未深度整合    小爱同学4.0    未全面开放系统权限,重点提升自身AI生态13
vivo    据传正在推进合作    预计为AIGC插件    尚未公开命名    面向系统层AI助手做布局1
⚙️ 合作趋势与挑战
技术整合加速:随着大模型在指令理解、多轮规划和工具调用能力的提升,手机厂商开始尝试更深层次的系统级整合,而非仅作为App内AI功能存在1。
系统权限之争:部分厂商对系统级AI助手持谨慎态度,担心数据安全与生态控制权被大模型厂商侵蚀。例如荣耀工程师曾公开表示,“两个矮子合作未必能生出高个子”,但仍在大会上“站台”13。
用户需求驱动:AI助手的便利性正在成为用户刚需,尤其是在跨平台操作、任务自动化等场景。尽管豆包手机助手面临微信、淘宝等App的“围剿”,其创新方向仍被视为未来趋势19。
✅ 结论
手机厂商正在靠拢豆包大模型,但合作模式多为模型调用,深度系统整合仍有限。豆包手机助手的跨应用操作能力虽引发行业震动,但也遭遇超级App的权限封堵。未来,系统级AI助手的生态开放与技术落地,将成为厂商与平台博弈的重点。
如何不发帖就快速得到金币道行
 
天人地
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个