拥有实时双向翻译、照片消除路人等功能的AI手机,销量正创下新高,AIGC已是决定手机厂商座次的关键,端侧大模型则是胜负手之一,各大厂商纷纷布局。
苹果今天发布了个人AI系统苹果智能,并整合ChatGPT功能至Siri及各个书写工具中。三星、荣耀、OPPO、vivo等厂商已推出了搭载端侧大模型的AI手机。华为则投资了端侧大模型初创企业面壁智能。
由于运行端侧大模型会大幅增加手机的负荷,因此,如何将更大参数的模型塞进手机,或者令小参数的模型实现更高的性能,带来新的挑战与机遇。
北京时间2024年6月11日,苹果全球开发者大会开幕。苹果宣布,其混合现实头显Vision Pro在美国以外市场销售,6月14日上午9点向中国内地、中国香港、日本和新加坡的用户开放预购,6月28日起正式发售,国行版售价为29999元起,容量为256G、512G以及1TB。
而在两个小时的主题演讲中,苹果最新发布的个人智能系统“Apple Intelligence”(苹果智能)独占了1个小时。
在介绍中,苹果将Apple Intelligence定义为可应用于iPhone、iPad和Mac等智能设备的个人AI系统。其能够利用苹果芯片的能力,提供照片消除路人、编写文案等覆盖语言、图片、动作和个人语境四个维度的AI服务,其中大部分的信息处理和保存在本地设备上进行。
同时,苹果也宣布与Open AI合作,用户将能够通过Siri,免费获取ChatGPT提供的回答,包括文字和图片。苹果表示,未来可能会与其他第三方大模型合作。
不过,或受限于芯片性能,目前Apple Intelligence只能在iPhone15Pro和iPhone15ProMax,以及搭载有M1芯片(及更新的M系芯片)的设备上运行,且Siri的AI服务仅支持英语,包括Siri和设备语言都需设置为英语(美国)。
例如,小米在2023年10月发布的Xiaomi 14系列,即能够在离线状态下使用“AI去除路人”功能园林景观设计公司,过去该功能需在“美图秀秀”等App中付费使用,售价为30元/月,且需连接网络。
在海外市场,三星AI手机Galaxy S24新增的双向通话翻译功能,则能够即时翻译13种异国语言,让通话双方听到翻译后的语音及文字,让用户跨越语言障碍(表1)。
消费者也愿意为之埋单。亮眼的Xiaomi 14系列,首周销量即突破百万台,“这个成绩应该是除iPhone外,近几年国产手机全价位段销量的最高峰。”Redmi市场总经理、Redmi品牌发言人王腾称。
在韩国,Galaxy S24用时28天突破百万销量的成绩,也创下S系列机型的销售纪录。
本土厂商中,OPPO成立了AI中心,整合全球资源向AI集中;小米AI团队人员规模已达3000多人,并在2023年4月组建了超1200人的AI大模型团队;vivo组建了千人规模的AI专家团队,并在2018年成立了人工智能图谱研究院;荣耀发布了AI使能全场景战略,并表示任何手机操作系统都值得用AI重做一遍;中兴、魅族等蛰伏于二三线的厂商,则发出了“All in AI”“All for AI”的宣告……IDC预测,中国AI手机的市场份额在2026年将很快飙升至45.3%。
苹果在举行此次全球开发者大会之前,也已在大幅追加生成式人工智能(AI-Generated Content,简称“AIGC”)领域的投入。在5月初举行的第二季度财报电话会议上,苹果CEO库克预测,苹果在AIGC领域将超越竞争对手,并有望引领行业标准。而在今年2月,苹果爆放弃了已投入10年时间、耗费数十亿美元的电动汽车项目,部分员工转移至AIGC团队。
AIGC在逻辑推理、语言理解、长文本等方面出众的能力有目共睹,也正在为创新乏力的手机厂商提供新的升级方向。“2024年是AI手机元年。AI手机也将成为继功能机、智能手机之后,手机行业的第三阶段。这轮由大模型支撑的AI技术,正在重构手机行业的未来。”龙年伊始,OPPO创始人兼CEO陈永明在公开信中作出最新表态。
那么,为了不被AI浪潮挤下牌桌,各大厂商究竟如何布局?所谓的AI手机,究竟关联着哪些核心技术?
随着Kimi、文心一言等App和小程序的推出,当前大部分的智能机用户都能够体验到前沿的AI功能。那么,AI手机与普通智能机相比,又有何不同?
从苹果对Apple Intelligence的定义不难看出,AI手机的一大特征,是在断网状态下依旧能够提供AI服务,包括路人消除、实时双向翻译、通话摘要等。而做到这一步的核心,在于端侧大模型。
所谓端侧大模型,指能够在终端设备,比如手机上运行的AI大模型。其主要依赖终端本地的芯片等硬件提供算力和算法,实现一系列的AIGC能力。
同时,端侧大模型也是手机AI能力可持续的重要一环。当前用户在美图秀秀、Kimi、文心一言等App和小程序使用AI功能时,算力主要由云端服务器提供,成本极高。相比较下,用户通过AI手机搭载的端侧大模型使用AI消除等功能,成本只是手机功耗提升,耗电量增加。园林景观设计公司
“现在应用一次云端大模型的成本大概在1.2-1.5分左右,若vivo国内3亿用户每天用十次,一年算下来也有百亿元左右的支出。”vivo副总裁周围在2023年表示。当然,如今阿里巴巴、百度等大模型算力供应商都在大打价格战,云端大模型的运行成本也已大幅走低。
而端侧大模型的优势也远不仅是成本。基于个人的差异化需求,当前手机厂商对于AI应用的另一趋势,是将端侧大模型的算力融入至操作系统,让手机成为一个能够管理用户各类数据,识别用户需求并提供服务的AI智能体(简称“AI-Agent”)。“我们认为任何手机操作系统都值得用AI重做一遍。”荣耀CEO赵明称。
据新财富统计,目前市面上AI手机所搭载的端侧大模型,大部分为各厂商自研(表2)。当然也有特例,如三星Galaxy S24系列,在海外市场主要采用谷歌的“Gemini Nano”,而在中国内地则由百度的“文心大模型”提供端侧AI能力。但随着三星于2023年11月公布了自研大模型“Gauss”,未来,其手机产品搭载的端侧大模型是否会转向“Gauss”,也是未知数。
提出要用AI重做操作系统的荣耀,正将自研的“魔法大模型”整合到其操作系统Magic OS和所有荣耀设备中,并在2024年1月发布了全新的Magic OS 8.0,以及Magic 6手机。
Magic OS 8.0与旧版的最大区别,在于能够精准识别用户意图,预测并推荐用户所需的服务。以Magic 6新增的“任意门”功能为例,当用户需要导航微信聊天时所提及的地点,只需长按相关信息,拖至左右两侧屏幕唤醒“任意门”,操作系统即能识别用户的导航需求,匹配常用的导航App,实现地址一拖立即导航。此外,其语言助手YOYO,也集成了“个人事务助理”“图库语义搜索”“对话成片”等AI功能。
苹果尽管尚未公布Apple Intelligence的运行参数,但其今年密集发布的多个与端侧大模型相关的研究成果,也披露了部分研发进程。
这些研究成果包括可显著提升Siri在理解和响应用户指令方面能力的端侧大模型“ReALM”,该模型参数包括0.8亿、2.5亿、10亿、30亿四大规模,其中,仅0.8亿参数的模型,即能在上下文理解能力上打平甚至超越GPT-4;可针对移动用户界面理解与交互的端侧大模型“Ferret-UI”,其在理解应用程序在屏幕上显示的内容时有着显著的优势;在端侧独立运行的开源系列模型“Open ELM”,其包含2.7亿、4.5亿、11亿和30亿共四个不同参数版本,提供生成文本、代码、翻译、总结摘要等功能……
除了积极自研之外,苹果还在3月收购了加拿大一家初创生成式AI公司Darwin AI,该公司的核心技术之一是利用机器学习构建更小、更高效的AI系统。
在国内,小米、华为也正通过投资,加速大模型布局。其中,小米分别在2023年8月、10月先后参与了北京智谱华章科技有限公司(简称“智谱AI”)、北京百川智能科技有限公司(简称“百川智能”)的B+轮、A轮融资。
在硅谷科技媒体The Information对中国大模型企业的盘点中,智谱AI被认为是“最有可能成为‘中国OpenAI’的5家企业”之一,其余4家分别为MiniMax、光年之外、澜舟科技、月之暗面。
2024年1月16日,智谱AI发布了全新自研的第四代多模态基座大模型GLM-4系列,称性能相比上一代全面提升接近60%、模型性能直接逼近GPT-4,OPPO、华为也出现在其合作伙伴名单中。
华为在今年4月通过深圳哈勃科技投资合伙企业(有限合伙,简称“哈勃科技”)投资了一家大模型初创企业——北京面壁智能科技有限责任公司(简称“面壁智能”)。
面壁智能成立于2022年8月,其CEO李大海现在担任知乎技术总监,他从零开始为知乎搭建搜索和推荐业务,是知乎AI“智能社区”发起人。清华大学计算机系长聘副教授刘知远是面壁智能的联合创始人兼首席科学家,主要研究方向为自然语言处理、知识图谱和社会计算。
企查查显示,2023年4月,面壁智能完成天使轮融资,投资方为知乎以及智谱AI园林景观设计公司。2024年,哈勃科技领投面壁智能B轮融资,参投方包括北京市人工智能产业投资基金(有限合伙)、春华资本、知乎。
面壁智能今年2月发布了适配于主流手机的端侧大模型“MiniCPM”,并很快于4月进行了迭代升级。值得一提的是,2024年6月,美国斯坦福大学AI团队的两名成员森德哈斯·沙玛(Siddharth Sharma)和阿克沙·加格(Aksh Garg)正式发文承认,其发布的“Llama3-V”模型抄袭“MiniCPM”,并承诺下架相关套壳模型。这则新闻令面壁智能名声大噪。
根据公开资料,今年5月,上述团队在发布“Llama3-V”时表示,该模型在多个基准测试中能够与GPT-4V、Gemini Ultra、Claude Opus等知名模型一较高下。
需要解释的是,依据模型的规模定律,参数规模是决定模型性能的最关键因素,即参数越高,性能越强。以vivo发布的“蓝心大模型”为例,其70亿参数的模型,具备较强的语言理解和文本创作能力,而10亿参数级别的模型,则主要负责专业文本处理相关的工作。
但是,由于运行端侧大模型会大幅增加手机的工作负荷,因此如何将更大参数的模型塞进手机,或者令小参数规模的模型实现比肩大参数模型的性能,均是手机厂商尚需解决的问题。
除Apple Intelligence只能在苹果的部分设备运行外,2023年10月谷歌发布旗舰手机Pixel 8和Pixel 8 Pro时,也以“硬件限制”为理由,拒绝在Pixel 8上运行最新的大模型“Gemini Nano”,用户只能在隐藏的开发者选项中开启。
“Pixel 8只有8GB内存,如果贸然启用‘Gemini Nano’功能,很可能会影响用户的使用体验。与之相反,Pixel 8 Pro拥有12GB内存,能比较好地释放AI模型性能。”谷歌设备和服务软件副总裁Seang Chau解释称。
彼时,谷歌Pixel 8 Pro搭载的端侧大模型“Gemini”,参数规模分别为18亿、32.5亿。而到了2024年,除vivo外,OPPO、荣耀也同样将70亿参数的端侧大模型装进手机。
以OPPO为例,为了优化端侧大模型在手机上的运行能力,其做了不少技术攻关。
其一是内存压缩,通过对模型进行高精度4bit量化、蒸馏、剪枝的压缩处理,同时针对关键的应用场景做精调和预训练,在保留精度的同时减少损耗,最终让70亿参数大模型所占用的运行内存压缩至最小的3.9GB左右。“70亿大模型正常的大小是28GB。”OPPO软件创新中心总经理张峻曾表示。
OPPO推出的Find X7系列,运行内存分为12GB、16GB。可以参考的是,当前主流手机的运行内存在6GB-12GB之间,在没有大模型之前足以支持智能机的流畅运行。
其二,OPPO还自研了推理引擎AI Boost和Transformer加速库,优化内存管理,使功耗降低一半。同时与芯片厂商合作,通过并行计算的算子优化,降低时延。
值得一提的是,Find X7系列搭载的芯片是联发科的“天玑9300”。联发科在该芯片发布会上曾表示,结合其特有的内存硬件压缩技术等,可大幅减少AI大模型对终端内存的占用,最高可支持运行330亿参数的AI模型。
除OPPO外,小米也通过优化“AI路人消除”“AI扩图”等功能对手机内存的要求,将相关功能覆盖至“Xiaomi 13”等仅有8GB内存的手机中。
荣耀在2023年9月建立了生态联合创新实验室,其中一个目的即是与高通深度合作加速端部署AI大模型。值得一提的是,凭借NPU(Neural Network Processing Unit,神经网络处理器)和异构计算解决方案,高通的“骁龙8 Gen 3”芯片同样支持百亿级端侧大模型运行。
2024年5月,苹果发布了搭载于平板、电脑上的最新一代PC芯片“M4”。据悉,该芯片集成了苹果专门用于加速AI任务的NPU,其运算速度最高可达每秒38万亿次,相比A11仿生芯片中的初代神经网络引擎,提速最高可达60倍。搭载了“M4”芯片的iPad,能够更好胜任AI任务处理,比如,将4K视频中的目标对象从背景中分离出来、在弹钢琴时用Staff Pad实时自动创建乐谱。“没有M4就没有新iPad Pro。”苹果硬件工程高级副总裁John Ternus表示。
值得一提的是,将于今年下半年发布的新一代iPhone,料将搭载集成了该NPU的全新A系列芯片。在软、硬件领域的全面布局,无疑是库克对苹果在AIGC领域保持领先的信心源泉。
除了搭载更高规格的芯片、存储,加强适配及优化之外,为了将AI功能向中低端手机渗透,提升小参数模型的性能也是重要路径园林景观设计公司。
例如,面壁智能在4月发布的端侧模型系列MiniCPM-V 2.0,在同等性能参数更小、同等参数性能更强,超越“Mistral-7B”“Llama2-13B”“ChatGLM3-6B”等模型。此外,面壁科技同时发布的“MiniCPM-1.2B”,在参数减半的情况下,性能能够达到28亿参数版本的87%。
据悉,商汤(在4月23日举行的发布会上推出的18亿参数规模的“SenseChat-Lite”端侧模型,在基准测试中,全面超越了“MiniCPM-V 2.0”“Phi-2”等所有开源的同量级的大模型,甚至越级比肩一些70亿、130亿规模的大模型。同时,该模型也广泛适配至手机、电脑、VR、车载显示屏等多种硬件场景,以及包括高通、联发科等厂商的多款芯片。
发布会次日,商汤股价上涨31.15%,在7个交易日间的涨幅更是超过160%。
根据中金公司的观点,除智能终端、芯片、存储等企业外,端侧大模型也对散热、电池及整机设计等提出了更高要求,升级路径包括研发硅碳负极提升电池能量密度,通过石墨烯等新材料提升散热能力等。“在AI时代,随着算力提升带来的功耗提升,对电池续航能力的要求也更高。由于芯片算力提升,对应对散热的要求也会提升,但同时还要满足手机在重量、厚度等方面的整体设计要求,因此目前各家厂商的散热方案并不完全一致,但通过提升散热能力降低发热的整体思路一致。”
不难看出,AI时代,不仅是手机厂商,整个供应链的企业也都将会迎来一次洗牌机会。
尽管各厂商AI手机之间的差异化主要来自于端侧大模型与操作系统的融合及创新,但这并不妨碍云侧大模型的地位。
原因在于,云侧大模型擅长处理复杂问题的能力,能够满足用户在金融、购物、知识问答等领域的深层次需求。因此,端侧大模型与云侧大模型互为补充,“端云协同”也成为AI手机最佳的解决方案。
具体操作上,荣耀宣布与百度智能云进行合作,并发布了“百模生态计划”,让云侧通用大模型和各种行业垂域大模型可以通过货架化方式融入Magic OS中;OPPO、vivo在自研端侧大模型的同时,也发布了自研的云侧大模型;苹果则被爆出正与Open AI和谷歌接触,探索合作可能。
值得一提的是,中兴努比亚系列手机的智慧翻译、聊天对话、创意写作等AI功能,全部由云侧大模型提供。但中兴通讯高级副总裁、终端事业部总裁倪飞也表示,公司未来也会推进端侧模型。“这与主流手机厂商‘端云协同’的模式基本相同,可以有效平衡云端算力成本过高的问题,同时保护用户隐私。”
尽管当前手机在云侧的AI功能均不收费,但未来不排除付费可能。在Galaxy S24系列的介绍页面上,三星曾标注了Galaxy AI功能于2025年底免费提供给支持该功能的设备。三星方面则回应称:“目前没有2025年之后的计划,园林景观设计公司但不排除未来三星可能将其部分或全部AI功能变更为有偿服务。”结合公开资料,三星如“即圈即搜”等功能即集成了京东、百度、美团等多个第三方云侧大模型,由此产生的费用未来也不排除由模型供应商承担。
但毋庸置疑的是,手机是大模型商业变现价值最高的终端设备,未来其中也会有更多的商业模式创新。
过去十年,基于开放的安卓生态,以及对供应链的整合能力,小米、华为、OPPO、vivo、荣耀等本土厂商取代诺基亚、摩托罗拉、黑莓等旧势力,登上世界舞台。
根据IDC数据,2023年全球手机出货量排名前5的手机厂中,小米、OPPO、传音三大本土厂商分列第3-5名,合计份额达29.4%。此外,包括荣耀、华为、vivo等手机大厂,也占据着不低的市场份额。
如今的AI浪潮,对于志在跻身世界一流的本土厂商及产业链上众多的供应链企业而言,无疑是千载难逢的机遇。
本文所提及的任何资讯和信息,仅为作者个人观点表达或对于具体事件的陈述,不构成推荐及投资建议。投资者应自行承担据此进行投资所产生的风险及后果。
《新财富》杂志于2001年3月创刊,专注资本市场深耕细作,“新财富最佳分析师”“新财富金牌董秘”“新财富500富人”“新财富最佳投顾”“新财富最佳投行”等权威专业评选和《德隆系》《明天帝国》《收割者》等经典研究案例影响深远。
新财富杂志社旗下主要新媒体平台包括:新财富杂志微博、新财富杂志公众号、新财富杂志视频号。
地址:深圳福田区华富街道莲花一村社区皇岗路5001号深业上城T1栋59楼