ark Gurman称,在苹果网站上的iPad mini营销中,该公司重点介绍了四项功能,其中三项要到12月至3月之间才会推出。
苹果最新的AI功能
在今年的苹果全球开发者大会上,Apple Intelligence的亮相引起了广泛的关注。在6月10日,苹果公司宣布,个人智能化系统Apple Intelligence将为iPhone、iPad和Mac引入强大的生成式模型,为人工智能隐私树立了新标准,它能够理解个人背景,从而提供有用且相关的资讯。
根据苹果官方新闻稿,Apple Intelligence深度集成于iOS 18、iPadOS 18和macOS Sequoia中,充分运用Apple芯片对语言和图像的理解与创作能力,可做出多种跨App操作,同时结合个人场景,为用户简化和加快日常任务流程。
按照苹果公司的设想,Apple Intelligence会带来多个创新功能。在iOS 18、iPadOS 18和macOS Sequoia中会新增一个新的工具——Writing Tools。作为一款智能化的书写工具,Writing Tools能够为用户带来很多创新体验。比如,它可以帮助用户校对文本,包括单词选择和句子的格式;可以重写当前的内容,而不改变用户的本意;可以对文本进行总结,用户可以将这些结论作为关键点汇总,或者绘制成表格,这些摘要可以在邮件和信息应用中找到。
Apple Intelligence对Siri进行了全面的重构,使其具有更深的学习能力和更灵活的交互方式。Mark Gurman此前在报道中透露,Siri将能够分析用户的习惯、偏好,并提供个性化的建议。Siri里面也会加入一些新的工具,比如ImagePlayground、Genmoji等。这些工具均旨在提升用户创作趣味,以及社交互动的丰富度。
苹果官方对于ImagePlayground也会倍加推崇,认为其将为用户提供乐趣无穷的图像创作功能,帮助用户用全新方式进行交流和表达自我。ImagePlayground被内置在多款App中,借助这款工具,用户可以在数秒间创作出有趣的图像,且有动画、插画、手绘三种样式可以选择。用户还可以将使用ImagePlayground创作的趣味图像发送给朋友,甚至还会看到基于当前对话生成的个性化创意推荐。
当然,Apple Intelligence对于Siri的改变远不止于此。Siri还将有能力在各类Apple及第三方App中完成数百种新操作,且对于用户指令的执行更加准确,并具有个性定制的属性。参考苹果官方给出的示例,用户只需说出“从我的阅读列表里调出那篇关于蝉的文章”,或者“把周六那天的烧烤照片发给Malia”,Siri便会执行。
Apple Intelligence背后据悉拥有两套模型。本地模型是一个参数规模为3B的语言模型,测试得分高于Mistral-7B或Gemma-7B等市场上的7B模型;云上模型则是苹果在云端服务器部署的更大规模的大模型,云端大模型能够支持100k的词汇大小,而终端模型支持的是49k的词汇大小。
对于苹果公司而言,更显AI战略有重大改变的行为是,苹果公司将会在全平台中集成ChatGPT,用户利用Siri可以直接调用ChatGPT被集成的功能,如图像生成、文档理解等。用户也可以在Writing Tools等工具中使用ChatGPT的特殊功能,协助用户在自己的主题下生成需要的内容。
对于苹果Apple Intelligence的功能,用户肯定是十分期待,不过何时更新,还不太确定。Mark Gurman此前称,Siri的新特性预计将在iOS18.3系统中首次现身,这一时间点比之前设想的iOS18.4版本提前。不过,最近有用户在推特上发文称,已经在苹果下一版系统要更新的代码中出现对集成ChatGPT的描述,预计即将发布的 iOS 18.2 Beta中就会出现支持ChatGPT的Siri和iPhone 16的视觉智能。
苹果的AI创新挑战
虽然看起来苹果的AI创新还不错,且部分更新比预期的提前了,不过苹果内部员工对于该公司的AI水平并不满意。确实,深究苹果即将推出的AI应用,并没有出现行业创新引领的功能,都是别人已经展示过的AI应用。
苹果公司的内部测试显示,与苹果的Siri相比,ChatGPT的准确率要高出大约25%,并且能够回答的问题也多出约30%。因此,不少苹果技术人员认为,该公司的AI技术水平相较于最前沿的AI技术,落后了至少2年的时间。
为什么作为全球科技巨头的苹果,在关键的AI技术上落后了呢。目前来看,有两大重要的原因。其一是苹果的创新思维,过去很多年,苹果一直在以硬件创新为主导,尤其是在智能手机方面,iPhone的创新能力让全球科技人致敬。实际上,这些年苹果一直在践行创始人乔布斯的信念,那就是打造一个端到端的硬件全家桶,引领全球消费电子硬件产品的发展。
也就是在近几年,苹果在硬件创新方面开始乏力,设备全新外观、更强大的处理器、更强大的摄像头、新材料等苹果赖以成名的硬件创新方式,近两年的表现很难让人信服,因而产业界才开始更加关注苹果的AI技术创新。但苹果显然仍在经历硬件创新引领转变为软件创新引领的阵痛。
原因之二是苹果公司对于数据的保护态度,也就是苹果的隐私政策限制了苹果的AI创新。数据是AI技术发展的基础,没有数据的支持,再先进的算法和算力也无法发挥作用。要打造强大的AI模型,需要三项数据支撑:第一是高质量的数据集,能够显著提高AI大模型的精度与可解释性,并减少训练时长;第二是数据多样性,有助于模型更好地理解和捕捉不同的概念、语义和语法结构,从而提高其泛化能力;第三是大规模数据集,更大数据集通常意味着能够提供更丰富的信息供AI学习,减少拟合信息的输出,特别是对于深度学习模型而言,庞大的数据量是提高其性能的关键。
然而,保护隐私是苹果公司的金字招牌,这就导致苹果公司很难从其庞大的用户群里中间获取到大量的、有用的数据,因此到今天仍有相当一部分的Siri的答案来自人工撰写,这和ChatGPT生成差距明显。
生成式AI的下一步
随着苹果公司在全平台集成ChatGPT,苹果产品体现出来的AI能力并不会是弱项,因为OpenAI就是全球顶尖的AI公司。那么,后续苹果自己的AI技术还有希望赶超吗?我们先看一下生成式AI后续的趋势。
首先是强化学习和生成的融合。强化学习是一种通过与环境交互学习最优行为策略的机器学习方法,而生成式AI则是一种通过学习数据分布来生成新数据的技术。通过在生成式AI生成的过程中引入强化学习,可以增强图像生成和编辑、自然语言生成、视频生成、音频生成等方面的能力。不过,相较于完全推理生成,加入强化生成可能会带来生成答案的延迟,但结果质量会更高。
其次是跨模态生成能力提升,跨模态是指处理来自不同感官通道或表现形式的信息的能力,例如文本、图像、音频、视频等。跨模态理解与生成技术的目的在于建立不同模态信息之间的桥梁,实现它们之间的转换和交互。这种能力提升的意义在于,它能够突破单一模态的局限性,充分利用多模态信息的互补性,提高信息处理的准确性和丰富性。
第三是深度个性化生成,目前生成式AI 大多是基于大规模数据集的训练,生成结果缺乏个性化和定制化,随着算法的更新以及用户数据的进一步收集,可以让模型生成更加趋向于个人定制。
此外还有减少模型幻觉、提升模型创造力等。不过,在这些趋势里,有两个关键的因素,一个是算法,还有一个是数据。我们相信苹果软件算法团队的能力,但是苹果如果难以解决数据难题,那么其AI技术恐怕难以追上顶尖对手。
结语
Apple Intelligence让苹果的AI似乎又没有那么落后了,但其中一部分功劳要归功于OpenAI公司的ChatGPT,苹果自己的AI技术正如其员工所言,仍至少落后两年。生成式AI下一步的趋势已经明朗,但苹果自身的障碍仍在,目前来看除了引入外援,苹果很难靠自己引领AI创新了。