尽管大模型算力消耗惊人,但这并没有阻止各大科技公司将AI应用于其他设备,比如智能手机。
(资料图)
一个月内,已有多家科技厂商对AI大模型在手机上的应用作出公开表态,以自研或者合作的方式进入这一狂热的赛道。
“手机上的对话助手、智能相册和地图等都可以基于AI大模型升级。”IDC中国研究总监卢言霞对第一财经记者表示,生成式AI的应用,例如语音修图、智能对话、文生图等也将逐步得到落地。
“但预训练大模型的进展和手机端算力的不断提升是实现这些应用的关键因素。大模型的成败高度依赖于算力的支持,而一个大型的人工智能大模型通常需要使用数万亿个单词进行训练,其参数量也达到了上万亿级别,这对于手机终端来说仍是一个巨大的挑战。”卢言霞说。
“大模型手机”要来了?
ChatGPT引发的全球AI领域军备赛,已经从互联网蔓延至手机端。
今年5月,OpenAI发布了ChatGPT应用程序的iOS版本。不到三周,市场下载量便高达500万次。在那前后,与AI大模型相关的APP已充斥在iOS与安卓应用商店中。
在互联网厂商还在讨论“中国版ChatGPT”何时诞生的时候,手机厂商以及产业链玩家也在寻找大模型为手机产业带来的新机会,试图从中分得一杯羹。
“我们内部正在就网络大模型方面的需求跟互联网公司进行合作,目前已(和意向公司)有所接触。”荣耀CEO赵明在此前举行的上海世界移动通信大会上对记者表示,正在把AI大模型的能力引入终端。
赵明表示,荣耀在AI上的布局分为三个阶段:第一阶段是从0到1提出概念,将需求场景化,比如相机可以直接识别绿植、天空,AI能够对图像进行对应的优化;第二阶段,AI有了上下文理解与学习,基于位置、时间对消费者习惯进行整合式机器的决策。第三阶段就是把AI引入端侧。
在赵明看来,智能手机行业正处在一个AI、5G+开启的新一轮创新周期中,而智能手机是计算平台、通信平台、显示平台、AI平台的集合,智能手机的发展就是不断打破边界、集成新技术、融合新品类的过程。AI、通信技术的持续演进,以及新形态的发展为智能手机打开了机会大门,利于行业重回千帆竞渡态势,共同开启下一个黄金周期。
除了荣耀外,国内厂商方面,华为以及OPPO也在低调部署。
目前,华为基于多模态大模型技术,通过在手机端侧对模型进行小型化处理,完善了手机在海量图片中的搜索能力。
OPPO研究院6月初则在一篇论文中介绍了一款专注图片标记的基础模型“Recognize Anything Model”,而在此前更是与阿里大模型展开深度合作。
OPPO中国区总裁刘波对记者表示,内部也在思考大模型在手机端的应用,未来AI或将改变整个手机产业链。
以语音助手为例,该技术采用的也是深度学习模型,但语音大模型可以替代语音助手工作模块中对语义理解的功能,修复此前因为唤醒和识别错误带来的不便。
微软CEO纳德拉曾直言不讳地指出语音助手的“愚蠢”:“无论是Cortana、Alexa、Google Assistant还是Siri,这些语音助手笨得像块石头。”但在未来,语音助手或许可以真正像个人助理一样,精准地帮助用户实现预订机票、网上购物等功能。
赵明对记者表示,现阶段荣耀以MagicOS中“YOYO建议”已经可以提供基于地理围栏、用户习惯等数据的多场景个人化提醒。“Magic V2上将会部署AI功能,在未来可以通过在端侧引入AI大模型赋能语音智慧助手,提供更自然的交互与更精准的意图识别服务。”
算力与成本下的挑战
但和其他大模型公司所遇到的一样,在手机端侧上实现这一技术的最大挑战来自于两方面,其一是算力,其二是成本。
在卢言霞看来,将大模型部署到手机端进行推理主要有两种方式,一种是通过云端进行推理,一种是在手机端直接进行推理。如果选择回传云端推理,则对手机的通讯能力要求较高;而如果选择在手机端推理,则对算力有一定的要求。尽管技术提供商会对模型进行剪枝和压缩等优化,但仍然需要一定的算力。
例如,ChatGPT这样的超大模型需要1000张主流卡容量的独立计算集群,以及对应的模型并行算法框架来支持训练。在成本方面,超大模型的训练需要大规模计算集群以及对应的模型并行算法框架的支撑,因此训练成本通常很高。ChatGPT单次模型训练耗时1个月,训练成本达1200万美元。
CounterpointResearch分析师FloraTang对第一财经记者表示,手机公司的软件工程团队相较于互联网公司而言,人力较少,所以从大模型的自研角度是不现实的。但可以选择一些已有的合作方进行大模型领域的技术优化。
但从手机产业链来看,上游芯片厂商正在做出努力,试图在英伟达统治的算力江湖下找到缝隙,以减少成本并且实现对AI芯片的把控能力。
高通前不久提出了一个云边一体“混合AI”的概念,并计划在今年下半年对外展示在手机上运行100亿个参数的大语言模型。从高通已有的模型落地案例来看,其边缘大模型相当于云端大模型的“感知器官”,从而实现AI功能在终端设备的实现。
同时,虽然苹果并没有直接表态,但从其芯片布局来看,苹果已经公开进入生成式AI训练硬件领域。“M2芯片家族的最新成员M2 Ultra是苹果在AI领域一个值得关注的地方,这种能力可能会在训练大模型上派上用场。”FloraTang对记者说。
值得注意的是,今年6月,iOS 17发布的开发者版本中,其中一个改动是“Hey Siri”去掉了前缀,用户仅需说“Siri”就能唤醒语音助手。这一变动背后也有来自于语音大模型的支撑。
国内厂商方面,荣耀在上海所布局的一家芯片公司也受到了行业内的关注。在随后的回应中,荣耀表示,上海荣耀智慧科技开发有限公司主要进行的是终端侧核心软件、图形算法、通信、拍照等方面研究开发工作。
结合赵明此前在采访提及的“将在算力中心进行端侧大模型的前置算法训练”,上述芯片公司的定位或与荣耀端侧AI大模型布局有关。
在业内看来,不管是自身技术实力的积累还是与未来与苹果在AI上的竞争,拥有处理AI数据的能力变得越来越重要。
“大型模型将在云中进行训练,但真正的价值在于更小、更高效的模型,这些模型经过调整,可以在手机终端设备上运行。”FloraTang说。
但对于何时能真正迎来手机端的“ChatGPT”时刻,卢言霞则对记者表示,这取决于大模型本身的进展。一些小的应用,例如对话式应用,很快就可以落地。然而,对于一些具有挑战性的应用,例如文生图或者在现有APP中嵌入这些应用,可能还需要一定的时间。
(文章来源:第一财经)