
今年1月,宣布将在其产品中使用Gemini大模型,这相当于承认这家iPhone制造商过去几年在人工智能领域无法凭一己之力参与竞争。但该协议也表明,苹果正再次依靠外部公司弥补另一项短板:云计算能力。
如今,苹果有可能进一步加深对谷歌云的依赖。据两位了解谈判情况的人士透露,应苹果要求,谷歌已研究在其数据中心内部部署服务器,用于运行即将推出的Siri版本。这款由Gemini驱动的数字助手,同时将符合苹果的隐私标准。苹果目前已在在线存储、内部AI模型训练等服务上依赖谷歌云。
过去,苹果曾表示,会将用户发出的复杂AI查询请求,发送至名为私有云计算(Private Cloud Compute) 的苹果系统,该系统运行在搭载苹果自研芯片的服务器上(简单AI查询则在设备本地处理)。
多年来,苹果一直渴望在云计算领域实现自给自足。公司多位高管曾试图搭建内部基础设施,以减少对谷歌、云科技等云服务商的依赖。
但据十几位苹果前高管和工程师称,这些云相关努力过去屡屡受阻,原因是苹果财务高管将云计算视为令人厌烦的成本中心,而非战略重点。这些人士表示,苹果不愿对自有基础设施大举投入,导致云领域专家不断离职。
近年来,外界越来越质疑苹果相较同行在数据中心投入不足,苹果则向投资者表示,其“混合式”基础设施策略——结合公有云服务与苹果自有基础设施——运行状况良好。
苹果在云计算上的困境,与其在AI领域的受挫并行发生,且在很多方面相互关联。过去一年,苹果难以按时推出由AI驱动的Siri全面改版,已上线的AI功能也反响平平。
前员工透露,苹果私有云计算的平均利用率仅为10%,使用率低到部分为苹果AI云准备的服务器仍存放在仓库中、尚未安装。不过,如果苹果宣称今年推出的新版Siri受到用户欢迎,其AI算力需求可能会迅速激增,这也能解释苹果为何与谷歌商谈托管助手事宜。
苹果在云计算上依赖谷歌,与该公司一贯坚持掌控产品核心组件的理念形成鲜明反差。苹果以自主设计硬件、软件、芯片等关键部分著称,以此让设备相比竞品具备优势。
与此同时,苹果也以精打细算闻名,尤其在修建数据中心这类需要巨额前期资本支出的项目上。近年来,Meta、、谷歌、亚马逊等公司为适配AI需求爆发,史无前例地大举投入建设数据中心,而苹果基本置身事外。
相反,苹果财务高层更倾向于从外部云服务商租用AI算力及其他服务。诚然,正如OpenAI和Anthropic所证明的,拥有自有数据中心并非成为AI领导者的前提。但一旦云服务商选择提价,过度依赖外部公司可能会令其后悔,届时AI公司或许被迫自建更多服务器。
前苹果云工程师表示,或许更严重的问题在于,苹果文化仍围绕设备销售展开,而设备销售占其营收绝大部分。即便苹果从音乐、App Store及其他服务中赚取更多收入(这些服务要么运行在自有云基础设施,要么租用其他厂商服务器),这一点依然没有改变。
苹果混乱的后端内部基础设施进一步加剧了困境。公司内部多个部门使用各自的服务器或各类云服务,与谷歌等其他大型科技公司统一算力资源池供工程师调用的模式形成对比。
曾参与下一代Siri研发、并于去年12月离职的伊戈尔·纳夫纽克此前在谷歌基础设施部门工作十余年,他表示:“苹果和谷歌的工程文化截然不同。谷歌大部分系统是集中式的,所有人使用同一台超级计算机;而在苹果,技术选择是相互割裂、各自为战的。”
严控成本
苹果的云困境可追溯至数十年前。
2003年iTunes音乐商店上线后,苹果开始扩大小型数据中心规模,以支撑数字音乐销售这一蓬勃发展的新业务。
随着苹果在线服务不断扩张,其使用了五花八门的系统分别运营。例如,2008年推出的个性化歌单功能iTunes Genius,搭建在与iTunes相独立的技术和服务器上,原因是苹果希望对用户音乐库分析数据进行匿名化处理。
大约在同一时期,苹果开始越来越依赖公有云服务——这一当时新颖的概念由亚马逊云科技开创,即向外部企业客户出租大型数据中心。AWS是苹果2011年推出的iCloud存储服务的早期在线存储提供商。
但当苹果计划推出iCloud照片备份功能时,随着大量iPhone用户拍照,公有云存储的高昂成本让公司不堪重负。为节省开支,苹果开始自建服务器用于iCloud照片备份。此举还带来另一好处:据参与该项目的一位苹果前高管称,当苹果告知AWS其计划后,亚马逊将向苹果收取的云服务费用减半。苹果此后继续同时使用自有服务器与云服务商服务器。
到2013年,苹果财务部门对公有云及自有服务器带来的成本飙升感到不满,开始询问服务团队是否充分利用了公司已有的内部基础设施。
前苹果工程师表示,这些团队显然在服务器部署上缺乏协同,导致基础设施重复建设、资源闲置。例如,iTunes服务器有闲置云容量时,其他苹果团队无法使用。
2013年,苹果指派时任工程总监帕特里克·盖茨,负责将分散的服务器基础设施整合为所有团队均可使用的公共资源池。他牵头成立了新部门“平台基础设施工程”,参照亚马逊和谷歌的现代云系统模式搭建共享资源。
ACDC项目
但据前苹果工程师称,盖茨难以推动公司各部门使用这一集中化平台,最终于2018年离职。2019年,曾任推特工程副总裁、微软云早期工程负责人的迈克·艾博特接手该部门,继续推进项目。
艾博特试图在苹果内部塑造更偏向云服务的文化。2021年,他在公司内部发起“基础设施峰会”线上活动,旨在推动全公司在共享基础设施上协作。
他还推动了多项新举措,其中最著名的是ACDC项目,即将苹果芯片技术应用于自有数据中心服务器。该项目全称“Apple chips in data center”(数据中心使用苹果芯片),初衷是让运行苹果在线服务的数据中心,达到与苹果设备同等严格的隐私标准。
据此前报道,他还提议苹果考虑最终向外部开发者出租服务器,类似亚马逊和谷歌的公有云服务。该项目前负责人称,苹果芯片主管约翰尼·斯鲁吉是这一项目的强力支持者,认为这是向企业客户提供其团队研发芯片的机会。
但该团队前员工表示,由于财务部门反对,艾博特的多个项目推进困难。财务团队认为,现有服务器利用率不足,不愿再为苹果自有云服务追加投资,并相信依赖外部云服务商能更好地控制基础设施成本。
2023年,艾博特离开苹果加入。他的离职很快引发苹果云领域人才流失,许多他招募的员工随即追随其加入这家车企。
转向谷歌云
2022年底ChatGPT 3.5的问世,对整个科技行业是颠覆性时刻,也彻底改变了苹果对AI和云的思路。
在ChatGPT推出前,苹果对Siri的核心目标是尽可能高效运行,优先在设备本地而非云端处理用户交互,苹果认为这能更好保护用户数据隐私。ChatGPT展现出基于云端大模型的巨大潜力后,苹果意识到无法固守旧模式,需要更多借助云端算力。
但问题随之而来:苹果内部AI基础设施开始老化。相关人士称,2023年,公司开始停用数据中心大量逐渐故障的老旧英伟达芯片,这项工作多年前就计划开展,却一直被搁置。苹果需要用更适配最新AI技术的新型号替换这些老旧芯片。
在财务部门推动下,苹果选择主要依靠外部云服务商推进AI计划,如同其在存储等其他服务上的做法。长期云服务商AWS成为苹果AI布局的首个重要合作伙伴,苹果也是亚马逊自研英伟达AI芯片替代品Inferentia和Trainium2的早期客户。
与谷歌合作则更为曲折。多年来,出于隐私顾虑,苹果禁止AI工程师使用谷歌云。Siri处理苹果设备用户的个人身份信息,苹果不愿承担数据泄露给外部公司的任何风险。实际上担任苹果隐私主管的软件主管克雷格·费德里吉,多次否决使用谷歌云满足AI算力需求的方案。
但2023年,谷歌对安全系统进行升级,满足了苹果的隐私要求。苹果迅速开始采用谷歌云满足AI需求,包括使用谷歌定制芯片张量处理单元——苹果测算后发现,其运行成本远低于英伟达同类芯片。
私有云
苹果需要向外界证明自己正严肃对待AI。ChatGPT的爆发式增长,迫使谷歌、亚马逊及几乎所有大型科技公司纷纷推出更智能、更具对话能力的AI产品。在2024年苹果全球开发者大会上,苹果终于行动,宣布推出Apple Intelligence——一套基于ChatGPT所普及的生成式模型的AI工具集。
苹果指派此前由艾博特牵头的ACDC项目团队,协助Apple Intelligence上线。尽管该项目最初并非聚焦AI,团队仍紧急搭建了代号“顶针项目”的私有云计算系统,为苹果下一代AI产品提供更私密的算力支持。参与该项目的前员工称,尽管苹果在2024年6月与Apple Intelligence一同宣布了私有云计算,但该系统当时尚未实际运行,进度滞后六个月(最终于2024年底上线)。
随后数月,苹果陆续推出Apple Intelligence部分功能,如AI写作工具、通知摘要等,但公众和科技评论者普遍感到失望。对苹果而言,更严重的问题是,经过全面改版、更具对话能力的Siri版本迟迟无法推出。
苹果与谷歌就Siri托管展开的商谈,可能表明苹果希望为今年晚些时候新版Siri推出后、设备端AI活动激增的情况做好准备。
商谈背后的另一个原因可能是,私有云计算在苹果自有数据中心内运行效果不佳。前员工称,其AI服务器的软件更新耗时远长于其他类型服务器。此外,苹果云工程师和AI部门前员工表示,私有云计算服务器上的苹果芯片并非为AI设计,难以很好地运行谷歌Gemini这类大模型。
三一生活网