“豆包手机”在二手市场价格都翻倍了……

注解

AIOS

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
AIOS = “AI Operating System” 人工智能操作系统
意思是:
以 AI 为核心能力,从系统底层深度融合并驱动设备的软件系统。
不是简单在系统里放一个“AI助手 App”,而是让 整个系统架构、交互方式、资源调度、应用生态都围绕 AI 重构。

为什么各大厂都争抢 AIOS 赛道?
1. AIOS 是下一代“入口”之战
因为未来用户不是“点应用”,而是“说需求”。例如:“帮我订明天的票。”、“做一份年终PPT。”
2. AIOS = 软件架构重排,谁先做成谁就拥有标准
AIOS 架构是:AI 为中心 → AI 调用系统资源和 App → 用户自然语言表达
谁先落地 AIOS,谁就能制定行业 新标准(API、隐私、调度、插件协议)
3. 用户行为正在改变:从“点 App”变为“说需求”
用户已经开始习惯:用 AI 处理文件、 写文案、做搜索、总结、作图、剪片、做 PPT
厂商如果没有 AIOS,就只能停留在“手机硬件厂”,被时代淘汰。
4. AIOS 重新定义“手机价值链”
过去手机比的是:硬件(摄像头、屏幕、芯片等已经差距很小的工艺)
未来手机比的是:AI 推理速度(端侧大模型)\系统级 Agent 能力\系统对于 AI 调度的深度(权限、资源、系统调用)。没有 AIOS = 没有未来竞争力。
5. 没有 AIOS,AI 助手永远只是“小玩具”
纯 App 级 AI 永远有各种各样的对手机软硬件的权限限制:
AIOS 解决的是:让 AI 成为整个系统的“总控制台”。
总结:
各大厂疯狂争 AIOS,不是为了卖 AI 手机,而是为了争夺:下一代移动入口、下一代操作系统标准、下一代用户行为模式、下一代生态主导权

GUI Agent

1
2
3
4
5
6
7
8
9
10
GUI = Graphical User Interface 图形化用户界面
GUI Agent = 能像“人类一样操作电脑界面”的 AI 助手
它不是只会在后台运行命令的 Agent,而是会直接在屏幕上点击、输入、拖拽、翻页、选择下拉框、使用软件。
GUI Agent 的核心能力
(1)读取屏幕画面。这依赖于 视觉大模型(VLM)。
(2)理解界面含义
(3)自动操作界面(就像真人)
(4)执行复杂任务
GUI Agent 解决了一个根本难题:以前的 AI 只能“给答案”,不能“帮你点按钮”。现在它能真正执行任务,而不是只给建议。

nubia

1
nubia /ˈnjuːbiə/ 

正文

“豆包手机”刚发售,火到3万台首批备货被一抢而空

甚至还有不少人在海鲜市场上溢价转卖,加价1500、直接翻倍的都有:

img

关键这还是在官方明确表示各种功能体验还不够完善的情况下……

img

说的就是搭载豆包手机助手技术预览版的工程样机nubia M153

不久前,字节豆包团队刚传出了要和中兴合作打造AI手机的消息,随后脚第一代产品就上架了。

nubia M153以售价3499元,仅面向想要体验豆包手机助手的行业人士少量发售

img

官方明确表示,在软件方面,“尚无法保证成熟手机产品的功能完善度”,比如影像等功能可能和市场主流旗舰机存在差距。

nubia M153的软件,大概每两周会进行一次更新。

img

目前,各方的实测体验也相当丰富,玩法涵盖跨App指令操作等多种场景。不少开发者和行业人士评价称“豆包勾勒出了AI时代手机的雏形”。

也有用户反馈,从实际操作时长来看,豆包助手目前的执行速度仍略慢于人工操作,但优势在于能显著减少用户的筛选和决策成本。

除此之外,据供应链消息人士向蓝鲸新闻透露,这次“豆包手机”确实是试水市场,“售罄后并未追加物料采购”。换句话说,这首批备货还可能成了“创始限量版”。该人士还透露“字节跳动与中兴通讯第二代产品已启动研发,在未出现其他变量因素情况下,预计于2026年底出货”。

虽然这两天关于“豆包手机”产生了一些争议,官方也已及时作出回应……

img

但抛开热议问题,它都有啥能力和功能?

豆包手机助手长啥样?

字节出这张牌目的不在AI手机本身,而是软件侧底层的AIOS赛道。豆包手机助手正是豆包团队与手机厂商在操作系统层面深度合作的产物,定位为系统级的AI助手。

先来看交互方式。在这款手机上,用户召唤豆包的方式多样:

  • 可直接打开豆包App
  • 能像唤醒Siri一样,通过语音呼叫豆包
  • 机身侧面专设一颗AI键,能按下此AI键交互
  • 佩戴豆包耳机Ola Friend也能直接唤起

img

能用来干啥?

用户可以针对当前屏幕内容或正在浏览的页面直接呼叫豆包,一键获取更多相关信息。

例如,在看到网友在社交平台发布的一张风景照时,按下AI键就能询问照片拍摄于哪里、视角来自哪个方向:

img豆包会给出具体的拍摄位置,并提示这是当地的经典观景点。

你还可以继续让它整理一份附近可拍摄点位的清单:

img

用户还能通过语音通话、视频通话或屏幕共享等与豆包互动。

双击AI键可以打视频通话,比如让它讲绘本,双语的那种:

img

在讲完绘本原有的文字内容后,它还会根据画面自动补充场景描述,让整个讲述更生动完整:

img

同时,多模态生成能力也有。

豆包手机助手和手机相册进行了系统级打通,可以让豆包一键P图:

img

接下来,是豆包手机助手的一项主打能力——代替用户操作手机

比如你在网上被种草了一款洗发水,就可以让它根据手机上已安装的购物软件进行全平台比价,最后一键自动下单。

img

指令发出后,豆包手机助手会接管手机,自动依次打开各类购物App,搜索商品并比对价格:

img

完成比价后,它会告诉你哪个平台最便宜,并在涉及付款等高敏感操作前,提醒你手动接管手机完成支付:

img

3万台首批备货被一抢而空

嘻疯 发自 凹非寺

量子位 | 公众号 QbitAI

“豆包手机”刚发售,火到3万台首批备货被一抢而空

甚至还有不少人在海鲜市场上溢价转卖,加价1500、直接翻倍的都有:

img

关键这还是在官方明确表示各种功能体验还不够完善的情况下……

img

说的就是搭载豆包手机助手技术预览版的工程样机nubia M153

不久前,字节豆包团队刚传出了要和中兴合作打造AI手机的消息,随后脚第一代产品就上架了。

nubia M153以售价3499元,仅面向想要体验豆包手机助手的行业人士少量发售

img

官方明确表示,在软件方面,“尚无法保证成熟手机产品的功能完善度”,比如影像等功能可能和市场主流旗舰机存在差距。

nubia M153的软件,大概每两周会进行一次更新。

img

目前,各方的实测体验也相当丰富,玩法涵盖跨App指令操作等多种场景。不少开发者和行业人士评价称“豆包勾勒出了AI时代手机的雏形”。

也有用户反馈,从实际操作时长来看,豆包助手目前的执行速度仍略慢于人工操作,但优势在于能显著减少用户的筛选和决策成本。

除此之外,据供应链消息人士向蓝鲸新闻透露,这次“豆包手机”确实是试水市场,“售罄后并未追加物料采购”。换句话说,这首批备货还可能成了“创始限量版”。该人士还透露“字节跳动与中兴通讯第二代产品已启动研发,在未出现其他变量因素情况下,预计于2026年底出货”。

虽然这两天关于“豆包手机”产生了一些争议,官方也已及时作出回应……

img

但抛开热议问题,它都有啥能力和功能?

豆包手机助手长啥样?

字节出这张牌目的不在AI手机本身,而是软件侧底层的AIOS赛道。豆包手机助手正是豆包团队与手机厂商在操作系统层面深度合作的产物,定位为系统级的AI助手。

先来看交互方式。在这款手机上,用户召唤豆包的方式多样:

  • 可直接打开豆包App
  • 能像唤醒Siri一样,通过语音呼叫豆包
  • 机身侧面专设一颗AI键,能按下此AI键交互
  • 佩戴豆包耳机Ola Friend也能直接唤起

img

能用来干啥?

用户可以针对当前屏幕内容或正在浏览的页面直接呼叫豆包,一键获取更多相关信息。

例如,在看到网友在社交平台发布的一张风景照时,按下AI键就能询问照片拍摄于哪里、视角来自哪个方向:

img

豆包会给出具体的拍摄位置,并提示这是当地的经典观景点。

你还可以继续让它整理一份附近可拍摄点位的清单:

img

用户还能通过语音通话、视频通话或屏幕共享等与豆包互动。

双击AI键可以打视频通话,比如让它讲绘本,双语的那种:

img

在讲完绘本原有的文字内容后,它还会根据画面自动补充场景描述,让整个讲述更生动完整:

img

同时,多模态生成能力也有。

豆包手机助手和手机相册进行了系统级打通,可以让豆包一键P图:

img

接下来,是豆包手机助手的一项主打能力——代替用户操作手机

比如你在网上被种草了一款洗发水,就可以让它根据手机上已安装的购物软件进行全平台比价,最后一键自动下单。

img

指令发出后,豆包手机助手会接管手机,自动依次打开各类购物App,搜索商品并比对价格:

img

完成比价后,它会告诉你哪个平台最便宜,并在涉及付款等高敏感操作前,提醒你手动接管手机完成支付:

img

在室外双手被占用、没法拿手机时,佩戴豆包耳机也能随时让这个贴身助手处理任务。

比如,一边走路一边口头询问某个播客节目是否更新、如果更新就加入播放列表:

img

可以继续让它帮你打开车后备箱,顺便预订好晚餐餐厅:

img

img

是生活助手也是工作助理。

你可以让它在飞书上代为请假、提交差旅申请、预订出差高铁票多个指令一次性下达,由它统一完成:

img

官方还介绍了更多使用场景,许多日常中相对繁琐的操作都能交给它:

下载多个购物App后,让它统一查询并整理所有物流进度;批量下载并整合文件;设置闹钟、记录备忘、拍照识物、多语翻译、通话内容自动生成摘要等,都不在话下。

另外,豆包手机助手还有记忆功能

若用户开启授权,它就会将记录的内容转为文本记录并保存到本地,智能识别纪要、总结、关键日程,能越用越懂用户。

由此,你可以询问它之前去过的咖啡馆在哪:

img

之前看过的取件码是多少:

img

而以上这些功能,其实都还只是基于操作手机标准版就能实现的。

团队表示,他们正在探索更高阶的“操作手机Pro”模式。

在该模式下,除可调用GUI Agent之外,还能直接调用更多系统工具;在记忆能力加持下,用户只需更短、更简洁的指令即可让豆包准确理解需求。

Pro版具备更强的推理能力,能够完成更复杂的操作任务。比如你要出国玩,可以下达长如此的指令:

img

它会拆解任务然后推理确认信息,分步骤逐一完成:

img

img

最后,官方也表示,目前模型能力仍有提升空间,后续会持续进行优化迭代;在数据使用与脱敏方面,豆包手机助手官网的《隐私保护白皮书》已对各项功能的数据使用方式、保护机制与保存策略作出了详细说明。

One More Thing

这两天,有传言称豆包手机助手未经授权,侵犯用户隐私。主要因有人实测发现,其“拥有INJECT_EVENTS权限,该权限在安卓权限定义中属于操作系统高危权限”。

对此,豆包手机助手官方做出了回应:

INJECT_EVENTS确实是系统级权限,技术实现依赖Android系统级权限,有更严格的使用限制。拥有该权限许可,相关产品才能跨屏、跨应用来模拟点击事件,完成用户操作手机的任务需求。豆包手机助手需要用户主动授权,才可以调用该权限,使用操作手机功能。

并且还称豆包手机助手不会在云端存储任何用户屏幕内容

当用户给助手指令,要求操作手机时,助手确实需要读取屏幕,否则无法完成用户任务,但屏幕和操作过程都不会在服务器端留下存储,且所有的相关内容也都不会进入模型训练。

抖音集团副总裁李亮也发微博辟谣,他表示:

豆包手机助手是经过用户授权,才能完成操作手机的任务,所有权限的使用在官网的隐私安全白皮书中都有明确的披露,并不存在一些谣言所说的“入侵”、“越权”等行为。

另外,有传言称这款手机基本算是字节自己研发的,但是迫于压力说的合作,其实中兴只是代工。

据了解,豆包手机助手官方最新向新浪科技表示,“合作的工程样机由豆包主导AI手机助手的产品定义与体验,中兴通讯旗下努比亚nubia主导硬件工程与技术研发”。

以及这款手机也被发现了罗永浩“锤子手机”代码…毕竟锤子手机的结局,核心部分就是被字节收购了。

官方链接: https://o.doubao.com/