文 | 花儿街财经,作者 | Leon,编辑 | cc孙聪颖
互联网大厂进入AI终端市场的步调,比想象中来得更快、也更激进。
继阿里巴巴推出夸克AI眼镜之后,字节跳动近日发布“豆包手机助手技术预览版”,首批工程样机与中兴通讯合作定制,型号为努比亚M153,售价3499元,目前官网已售罄。
消息发布后,中兴通讯A股(000063.SZ)一度涨停,港股涨超10%。同时,由于工程样机销售基数较小,该机在二手交易平台被加价700至1500元不等。
在几乎所有手机都以“AI”为卖点的当下,手机厂商基本上都采用了接入大模型API+自研端侧模型的技术路线,提供如AI修图、写作等AIGC范畴的应用。
激进派如荣耀,则通过调用安卓系统的“无障碍模式”模拟点击,让AI替代用户操控部分App,比如点咖啡等。
与上述发展路线不同的是,字节跳动与中兴通讯进行深度合作,将豆包大模型及Agent集成在操作系统中,在一些场景下“接管”手机、实现自动化操作。这种“头部大模型+手机硬件”深度绑定的模式在市场尚属首例,受到行业和消费者的高度关注。
AI深度接管手机
手机语音助手诞生于智能手机发展初期,比较知名的是苹果Siri,在2011年作为iPhone 4s的新功能问世。由于彼时AI技术尚未迸发,语音助手功能较为局限,仅能实现问天气、定闹钟或是打开App等简单操作,并未从根本上改变手机的使用体验。
随着2022年GPT诞生,AIGC技术逐渐普及。在多模态大模型的加持下,手机助手逐渐从“App”转向“Agent”形态,简单来说就是能替代人操作手机、完成复杂指令,豆包手机助手便是基于这种逻辑的产物。
在视频中,工作人员用多种方式演示了如何使用豆包手机助手“接管”手机,比如全托管式的购物比价、下单到支付,除了支付等敏感环节需要用户手动完成,其他操作均可调用GUI Agent(模拟点击)实现。
而在更先进的“操作手机Pro模式”下,豆包不仅能够模拟点击、还可以调用多种工具,同时支持上下文记忆,可减少询问用户的频率,流畅性大幅提升。
工作人员演示了一个非常复杂的操作:下个月去巴黎,把社交媒体上收藏的巴黎餐厅在地图上标记一下,再看一下落地第二天哪个博物馆有展览,在旅行平台上订一张上午10点的票,把相关信息整理到备忘录。
豆包手机助手在处理该任务的过程中,相继打开了小红书、微信、大众点评、地图等多个应用,读取相关数据,顺利完成了地图标注。随后,通过调用“PersonalContext_Search”(个人上下文搜索)的工具,分析出用户喜欢的博物馆类型,继而查询展览日期并在旅行平台上完成订票,总计用时8分04秒。期间,只有确认关键信息、支付信息的时候才需要用户介入,其他步骤均为自动化,非常方便。
另外,一部分买到该手机的用户在社交媒体上分享了使用体验,包括自主拍照修图、点外卖、比价购物等,豆包手机助手均能较为流畅地完成任务。当然,由于尚处测试阶段,部分任务可能存在耗时偏长、需要用户多次介入等问题,有望随着软件更新不断优化。
豆包方面表示,将在发售起至2026年第一季度保持每两周左右(除节假日)一次的更新频率。
上线三天,用户微信出现“登录异常”
与传统语音助手不同的是,AI助手需要大量读取、调用用户以及第三方App的数据,用于更好地理解上下文含义,因此数据安全性和合规性都至关重要,也容易引发争议。
12月3日,也就是豆包手机助手上线的第三天,部分用户出现了微信被下线的情况。援引《第一财经日报》报道称,用户微信提示“你的微信登录环境存在异常。为了账号安全,请更换设备重新登录。”据悉,该用户尝试更换微信账号后,再次出现了被动下线的情况。
另外,如果有用户尝试通过豆包手机助手操作微信,会出现“豆包操作手机属于实验室功能,现不支持微信的操作。”
微信相关人士回应称:“没有什么特别的动作,可能是中了本来就有的安全风控措施。”参考《腾讯微信软件许可及服务协议》,其中明确禁止“通过非腾讯开发、授权的第三方软件、插件、外挂、系统,登录或使用本软件及服务,或者进行自动化操作,或者制作、发布、传播上述工具、方法等”行为。如有违反,腾讯方面有权限制账号功能甚至封禁账号。
事件发酵后,豆包手机助手于3日晚间发布公告称,被禁止登录的微信账号正在陆续解封。同时强调,豆包手机助手不存在任何黑客行为,需要用户授权才能获取INJECT_EVENTS权限(Android系统级权限),并且云端不会存储任何屏幕用户内容,相关内容也不会进入模型训练环节。
抖音集团副总裁李亮则在微博上发声:“我认为只要是用户许可就不存在侵犯隐私的行为。豆包手机助手是经过用户授权,才能完成操作手机的任务,所有权限的使用在官网的隐私安全白皮书中都有明确的披露,并不存在一些谣言所说的‘入侵’、‘越权’等行为。”
而对于豆包手机助手在读取及处理相关App数据的过程中,是否需要获得对应App运营方的授权?数据收集与使用遵循怎样的规范与原则?截至发稿时,中兴通讯方面还未对《华尔街科技眼》的访问,做出相关回复。
在豆包手机助手官网公示的《豆包手机助手白皮书》中,分四个章节介绍了豆包手机助手的信息安全能⼒和技术措施,承诺对云端、端侧数据的有限收集及合理使用,并对敏感数据实施安全加密、脱敏、隔离等保护措施,但并未明确列出它获得了哪些第三方App的具体授权。
这个小插曲,暴露了目前AI助手面临的第三方App调用困境。业内人士指出,虽然《网络数据安全管理条例》等法规对自动化工具、AIGC生成数据作出了相应规范,但由于AI手机(助手)数据流通涉及的主体众多,导致各环节责任归属尚无法界定。从第三方App厂商的角度来看,仅仅获得用户授权,并不代表AI手机(助手)可以托管其App或调用数据,毕竟可能涉及到商业机密。
积极的一面是,行业正在积极推动相关标准的建立。12月2日,云计算标准和开源推进委员会联合中国信息通信研究院发布的《端云协同智能体交互双重授权安全指引》,其中明确提到:智能体需同时获得应用授权与用户授权,才能合法访问第三方应用。
AI大厂的敲门砖,手机厂商的新机遇
虽然豆包手机助手尚处技术预览阶段,但显然获得了极大的关注,同时在一定程度上增加了中兴手机的曝光,可谓双赢。促成合作的,无疑是字节跳动和手机厂商各自的市场扩张诉求。
对于字节跳动而言,硬件是战略板块上的一块空缺。近年来,字节通过收购Pico、锤子手机、Oladance等资产,获得了手机、耳机、VR头显的硬件设计能力,但始终未能形成“王牌App+自研硬件”产品格局。而在豆包月活数量超过1.5亿之后,AI原生应用显然成为一个突破口。
在现阶段,豆包明确“无自研手机计划,和多家厂商洽谈豆包手机助手合作”,但其官网上的另一款豆包硬件Ola Friend耳机则是自研,出自其收购的Oladance品牌,说明字节跳动依然关注AI硬件市场,只是采取了一种相对稳妥的发展方式。
事实上,在智能手机发展初期,Facebook、阿里巴巴、腾讯等互联网大厂都曾涉足定制OS(或UI),通过与手机厂商合作的方式推出手机硬件,但均因竞争力不足未能进入主流市场,比如阿里云手机、HiQQ手机等。
互联网大厂的硬件情节,实际上源于“软硬结合”的逻辑。已故的苹果创始人乔布斯曾表示“苹果是一家软件公司”,核心竞争力来自研OS+硬件的组合,Mac、iPhone均是在此逻辑下诞生的产物,为苹果带来了极大成功。
如果说OS是旧时代的霸主,那么AI则是新时代的希望。阿里巴巴CEO吴泳铭在演讲大胆预言:大模型将会是下一代操作系统,AI Cloud是下一代计算机。这也解释了为什么互联网大厂纷纷进入AI硬件市场,不论是自研还是合作。
另外,在手机市场逐年低迷的情况下,AI也成为新的增长驱动力,受到手机厂商的重视。大模型训练属于重资产投入,并非所有企业都能负担,对于中兴这样的二线品牌而言,与头部大模型合作无疑是最具性价比的方式。
不过,“豆包模式”能否在市场中成为主流还有待观察。一方面,苹果、华为等手机大厂,与大模型厂商的合作相对谨慎,并且在自有OS的产品架构下,不太可能将核心权限开放给第三方大模型。
安卓阵营方面,国产手机厂商的态度比较开放。根据目前信息来看,OPPO、vivo、荣耀等厂商并未有集成豆包手机助手的计划,但不排除未来合作的可能性。据媒体报道称,一位手机厂商内部人士表示,下个月豆包应该会有一个技术方案发布,内部持观望态度,目前没有合作计划但不排斥。“需要视豆包的方案与我们自身想做的AI 功能的匹配度而定”该人士强调。
下一篇:没有了