糯麦 NurMai

400-158-5662

糯麦科技

/

新闻资讯

/

行业洞察

/

OpenAI的先进技术与创新理念的推动下,苹果决定为Siri注入新的智慧与功能

OpenAI的先进技术与创新理念的推动下,苹果决定为Siri注入新的智慧与功能

原创 新闻资讯

于 2024-05-29 22:18:39 发布

15944 浏览

在苹果公司宣布暂停造车计划,并集中资源于生成式AI领域约三个月后,他们即将在自家的终端产品中应用AI模型。据彭博新闻社长期跟踪苹果动态的记者马克·古尔曼(Mark Gurman)报道,经过两个月的深入谈判,苹果已与OpenAI达成战略合作,计划将OpenAI的聊天机器人ChatGPT集成到即将发布的iOS 18系统中。这一合作伙伴关系的正式公布预计将在6月的苹果全球开发者大会(WWDC24)上进行。


尽管与OpenAI达成了协议,但苹果为了确保技术多样性和竞争力,仍在与谷歌进行谈判,希望将Gemini作为其备选方案。


此前,苹果已经推出了包括OpenELM、MM1、Ferret、Ajax在内的多款AI模型,但此次古尔曼的爆料显示,苹果似乎更倾向于利用外部成熟的AI模型及其产品来加速自身的发展。


然而,在生成式AI的浪潮中,苹果确实显得有些滞后。去年5月,苹果公司CEO蒂姆·库克(Tim Cook)就表达了对AI潜力的兴趣,但也指出该技术尚存在诸多待解决的问题,并强调了在决定如何及何时应用AI时的深思熟虑的重要性。


过去一年里,华尔街的分析师们对苹果在AI领域的进展表示了担忧。在2024财年第2财季财报电话会上,所有提问的分析师都聚焦在AI问题上,但库克除了之前的评论外,并未透露太多关于苹果未来AI功能、服务或盈利模式的细节。


库克在电话会上表示:“我们不想在正式发布之前透露太多信息,但我们坚信生成式AI是我们产品的一个关键机会,我们拥有与众不同的优势。我们将在未来几周内进一步讨论这个问题。”而在近期接受路透社采访时,库克再次强调了苹果对生成式AI领域的乐观态度,并透露该公司过去五年在研发上已投入1000亿美元。


尽管苹果在生成式AI领域起步较晚,但他们凭借庞大的用户基础、完善的产品生态以及软硬一体的优势,依然具备强大的后发潜力。


在近日举行的“AI创生时代——2024甲子引力X科技产业新风向”大会的巅峰论坛上,出门问问的创始人兼CEO李志飞发表了见解:“大公司与小公司在运作机制上截然不同。对于大公司而言,后发可能转化为一种优势,特别是在构建大型AI模型方面。”


在生成式AI领域,存在两种看似矛盾但实则互补的优势。一方面,先行者凭借数据飞轮效应拥有先发优势;另一方面,后来者往往能以更高的投入产出比展现后发优势。


当前,一直占据AI领域先发优势的OpenAI,正成为苹果后发战略中的重要一环。同时,OpenAI也期望借助苹果的后发优势,实现更广泛的增长。


自从OpenAI发布GPT-4o以来,网络上就流传着苹果语音助手Siri可能面临挑战的言论。GPT-4o作为一款“原生多模态大模型”,其独特之处在于所有输入和输出均由同一神经网络处理,这意味着它不仅能处理文本,还能接受音频和图像的任意组合作为输入,并输出相应的文本、音频和图像。这一特性使GPT-4o成为一个兼具“听觉”和“视觉”的多模态模型,并支持对话中的打断和插入,同时拥有上下文记忆能力。


OpenAI官网博客的数据显示,GPT-4o在对话中对音频输入的平均响应时间为320毫秒,最短响应时间更是达到了232毫秒,这一速度与人类响应相近。


值得注意的是,OpenAI在演示GPT-4o时选择了iPhone作为平台。从OpenAI的野心和实力来看,他们不仅仅满足于开发一个APP,而是志在深入整个苹果生态,突破用户增长的瓶颈。


在GPT-4o正式亮相之前,ChatGPT曾遭遇长达一年的流量增长瓶颈。然而,随着GPT-4o的发布和其与ChatGPT的深度融合,ChatGPT在本月有望迎来网络流量的爆发式增长,有望创下新的记录。


SimilarWeb的统计数据显示,今年5月的前三周,ChatGPT网站的平均日访问量已达到约7700万次,预计本月总访问量将轻松突破23亿次,远超之前月访问量的峰值18亿次。


流量的激增自然引起了OpenAI的极大兴趣,而苹果则成为其重要的合作目标。英伟达高级研究科学家Jim Fan曾指出:“赢得苹果,就意味着赢得了市场的先机。”


实际上,OpenAI对于与苹果合作的“渴望”并非无迹可寻。去年秋天,科技媒体The Information就报道过OpenAI CEO萨姆·奥尔特曼(Sam Altman)与苹果公司前首席设计官乔纳森·伊夫(Jony Ive)正联手开发一款AI驱动的消费设备。同时,OpenAI还与多家风险投资界的巨头进行融资谈判,包括Emerson Collective和主要投资者Thrive Capital。


尽管OpenAI已逐渐走出增长困境,但苹果却仍面临增长的压力。根据苹果公司的最新财报,今年前三个月的营收为907.53亿美元,同比下降了4%。


与此同时,华为、荣耀、小米、OPPO等手机厂商纷纷在AI大模型领域积极布局,生成式AI已成为手机产业链竞争的新焦点。然而,苹果在这一赛道上的步伐显然稍显迟缓。IDC中国区副总裁王吉平曾指出:“拥有AI技术的手机厂商增长更为迅速。”


在多次传言和猜测之后,苹果最终选择与OpenAI合作,GPT-4o与ChatGPT结合后展现出的卓越实时交互体验和爆炸式的流量增长可能是促使这一合作达成的关键原因。


现在,苹果似乎已经做好了AI模型落地的准备,即将迈出实质性的步伐。距离WWDC24大会还有十多天的时间,但外界对于苹果与OpenAI的合作模式已充满好奇和期待。


今年的WWDC24大会中文海报以“大招码上来”为主题,预示着苹果将带来一系列引人注目的创新。然而,在苹果即将展示其技术大招之际,有几个关键问题不容忽视,特别是关于模型在端侧和云侧的应用以及用户隐私保护。


针对这些问题,知名科技分析师Jim Fan在社交媒体上发表了预测:


1. Siri的变革:OpenAI可能为iOS量身定制一个更小、更适用于纯设备环境的GPT-4o版本,同时提供付费升级选项以使用云端模型。


2. 原生功能增强:苹果可能将摄像头或屏幕与模型进行深度整合,提供芯片级的神经音频/视频编解码器支持。


3. 系统级集成:OpenAI的模型将与iOS的系统级操作API和智能家居API实现无缝集成。


4. Jim Fan进一步指出,通过为苹果设备训练端侧小模型,并对部分付费用户提供云侧大模型的方式,可以实现灵活的用户隐私保护策略。


此外,另一位知名记者古尔曼也曾透露,苹果公司计划将自研的高端芯片(如M系列芯片)应用于云计算服务器,以处理复杂的AI功能,而较为简单的AI任务则直接在iPhone、iPad和Mac等终端设备上完成。


然而,苹果要想充分利用OpenAI最先进的大模型,还需面对以下三个关键问题:


首先,Siri将采用何种模型?作为人机语音交互的核心,Siri是否会接入云端的GPT-4o模型,或是结合本地与云端模型提供服务,引发了广大用户的好奇与期待。


Siri与国内众多手机厂商在语音助手处理上有所不同,其唤醒和识别功能主要依赖本地处理。然而,端侧模型对手机硬件资源,如内存、CPU、GPU的算力要求极高。vivo副总裁、OS产品副总裁周围曾提到,端侧处理在性能和功耗上均面临挑战,如输入法出词推荐可能需要较长时间,且大模型运行耗电严重。


国内某手机厂商专家西风(化名)在专家调研会上指出,鉴于GPT-4o的庞大参数量和强大的算力需求,Siri在接入GPT-4o后不太可能继续沿用现有的端侧识别方式,而更可能采用云端识别。他推测,苹果唤醒功能可能直接使用GPT-4o的云端模型,但具体任务的执行策略将由系统引擎决定,即根据任务需求选择云端或本地模型。对于文本处理、生成等任务,本地模型足以应对;而对于需要高精度和细腻度的多模态交互(如视频功能),则可能需要调用云端模型。


这一推测与古尔曼的最新爆料相吻合。古尔曼透露,苹果的iOS 18和macOS 15将包含特定的软件机制,用以判定任务是在端侧还是云侧进行处理。


来自硅谷的某大厂生成式AI开发者丽声(化名)强调,由于苹果对用户隐私的极度重视,与OpenAI在大模型上的合作更可能仅限于云端,不太可能让OpenAI为其定制端侧模型。同时,她指出OpenAI对iPhone内应用的调用权限将严格受限于用户信息的隐私程度。


关于双方合作后的产品形态和落地时间,存在不同观点。赵冬帅,Tayside Investments Australia的资深分析师,认为苹果可能首先从PC端入手,推出搭载GPT-4o的Macbook,以应对微软的挑战,并可能为其定制硬件产品来凸显GPT-4o的语音和视觉交互功能。然而,西风则认为GPT-4o将主要搭载在iPhone上,预计iOS 18发布时将出现云端应用,而与硬件的深度融合则可能在今年9月的iPhone 17上体现。丽声则对苹果为GPT-4o定制新硬件的猜测持否定态度,她认为苹果的硬件战略相对稳定,不太可能因为与OpenAI的合作而轻易改变。


最后,接入GPT-4o后用户高频使用可能带来的算力调度与成本问题是值得关注的问题。面对全球超过10亿的iPhone活跃用户,苹果需要确保云端交互的顺畅,并有效解决算力成本的大幅提升问题。据悉,手机厂商每年向大模型供应商支付的费用大约在8000万元左右,而苹果接入GPT-4o后预计支付的费用将达到亿元级别。


考虑到未来iPhone搭载大模型可能带来的高算力和成本挑战,苹果正在探索一种更经济高效的云端算力解决方案:直接将PC端芯片M2 Ultra引入云端服务器。这一举措预示着苹果为了更好地参与生成式AI的竞争,似乎已将视线转向了算力端,并计划亲自涉足云服务领域。


来自硅谷某大厂的生成式AI开发者丽声证实了这一点。她表示,以往苹果在处理AI相关业务时,主要通过购买显卡和AWS云服务来提供算力。然而,作为一家拥有丰富软硬件资源的大厂,苹果在人力和财力方面均不缺乏,且公司内部许多员工也倾向于自主研发云服务。因此,她预测苹果未来可能不会再将大模型的训练和推理算力完全依赖于AWS,而是选择自主开展云服务业务。


除了云端算力,端侧算力同样至关重要。目前主流端侧模型的参数量均在百亿级别,为满足实时执行这类模型的需求,需要显著提升芯片性能。值得注意的是,苹果在其最新发布的iPad Pro中搭载了M4芯片,这款芯片是目前苹果性能最强劲的芯片。具体而言,M4芯片的NPU运算速度高达每秒38万亿次(38 TOPS),相较于上一代M3芯片的每秒18万亿次(18 TOPS)有了显著提升。这一进步不仅展现了苹果在芯片设计领域的深厚实力,也为其在AI领域的未来发展奠定了坚实基础。


解读这一数据的关键在于理解自动驾驶技术对算力的需求。以自动驾驶的算力需求为例,L2级自动驾驶大约需要20 TOPS的算力;随着自动驾驶级别的提升,L3级自动驾驶对算力的需求则跃升至50至100 TOPS;到了L4级自动驾驶,这一需求更是激增到约2000 TOPS。由此可见,当前M4芯片的算力水平,已相当于能够满足L2.5级自动驾驶的算力需求。


苹果与OpenAI的紧密接触,以及其在云侧和端侧算力方面的战略布局,均彰显出其在AI领域的坚定决心和雄心壮志。尽管目前双方的合作尚未正式公布,且苹果在中国市场的份额有所下滑,同时OpenAI的大模型在中国尚未获得落地资质(有传闻称,苹果正与百度谈判,以在苹果设备上使用百度的人工智能生成技术),但苹果和OpenAI如何携手打造下一代AI手机及其可能带来的影响,已成为安卓手机厂商不得不深思的问题。


在全球手机和PC厂商竞争激烈的生态中,苹果将大模型引入终端设备的举动,无疑为行业带来了新的变数和挑战。相较于其他已经在终端设备上实现大模型落地的厂商,苹果的后发优势在于其深厚的软硬件整合能力、庞大的用户基础以及对于AI技术的持续投入和创新。这些因素使得苹果有能力在AI领域实现跨越式发展,为行业带来新的变革。


苹果凭借其庞大的用户基础和完善的产品生态,展现出了显著的优势。据苹果2024财年第1财季的财报显示,全球活跃的苹果设备数量已超过22亿台,其中包括iPhone、iPad、Mac等。而根据Asymco知名分析师霍勒斯·德迪乌(Horace Dediu)的数据,仅iPhone在2023年就拥有超过10亿的活跃用户。


苹果的优势不仅在于用户数量,更在于其能够利用这些用户数据来训练大模型,从而增强自有模型的能力。反过来,这些能力更强的大模型又能为产品带来更加丰富的功能,吸引更多用户,进而形成一个良性循环的数据飞轮。


在软硬一体的战略上,苹果也展现了其独特的优势。丽声指出,苹果的自研芯片使其无需面临与其他厂商使用高通芯片时产生的沟通成本和上机时间成本问题。这种软硬一体的设计使得苹果能够灵活调整和优化其芯片设计,进而创新大模型的架构,而不仅仅局限于现有的模型架构。


尽管OpenAI即将成为苹果软硬一体战略中的一环,为苹果带来后发优势,但这并非长久之计。丽声透露,苹果与OpenAI的合作可能只是其在AI和大模型领域的一次尝试,未来苹果可能会完全采用自研的大模型。


她表示,虽然苹果在生成式AI时代入局较晚,但凭借其软硬一体的优势,依然能够创造出令人赞叹的交互功能。然而,苹果和OpenAI的合作能否成功,苹果是否能发挥后发优势打破增长困境、引领技术创新,还需拭目以待。


对于所有智能终端厂商而言,随着苹果等巨头的深入布局,新的竞争时代已经拉开序幕。这场战争将考验每个厂商在AI和大模型领域的战略布局和技术实力。

OpenAI

小程序开发

小程序设计

阅读排行

  • 1. 几行代码就能实现Html大转盘抽奖

    大转盘抽奖是网络互动营销的一种常见形式,其通过简单易懂的界面设计,让用户在游戏中体验到乐趣,同时也能增加商家与用户之间的互动。本文将详细介绍如何使用HTML,CSS和JavaScript来实现大转盘抽奖的功能。

    查看详情
  • 2. 浙江省同区域公司地址变更详细流程

    提前准备好所有需要的资料,包含:房屋租赁合同、房产证、营业执照正副本、代理人身份证正反面、承诺书(由于我们公司其中一区域已有注册另外一公司,所以必须需要承诺书)

    查看详情
  • 3. 微信支付商户申请接入流程

    微信支付,是微信向有出售物品/提供服务需求的商家提供推广销售、支付收款、经营分析的整套解决方案,包括多种支付方式,如JSAPI支付、小程序支付、APP支付H5支付等支付方式接入。

    查看详情
  • 4. 阿里云域名ICP网络备案流程

    根据《互联网信息服务管理办法》以及《非经营性互联网信息服务备案管理办法》,国家对非经营性互联网信息服务实行备案制度,对经营性互联网信息服务实行许可制度。

    查看详情
  • 5. 微信小程序申请注册流程

    微信小程序注册流程与微信公众号较为相似,同时微信小程序支持通过已认证的微信公众号进行注册申请,无需进行单独认证即可使用,同一个已认证微信公众号可同时绑定注册多个小程序。

    查看详情