0.6秒!手机跑stable diffusion创下最快速度,而这仅仅是开始 -尊龙凯时入口

来源:今日热点网 时间:2023-11-16 16:46:13

导语:如今,随着将大模型塞进手机的进程加快,普通用户也能亲自体验生成式ai的魅力了。

2023 已经行至尾声,这一年大模型和生成式 ai成为人工智能圈的主流趋势。自chatgpt 出现以来,各式各样通用、专业的 ai 大模型层出不穷,喷涌之势已经不可阻挡。随着量化、网络剪枝和知识蒸馏等模型压缩技术进步,手机等终端设备ai算力持续增强,大模型在云端部署之外正在向终端落地迈进。

对于这场已经拉开了序幕的「终端侧革命」,芯片巨头和手机厂商们成为主力军,他们不断尝试在手机等终端设备上部署运行生成式ai大模型,时不时给人们一点小小的惊喜和震撼。

今年2月,我们第一次看到了在手机上运行超过10 亿参数的文生图大模型stable diffusion。那是在一部搭载高通第二代骁龙 8移动平台的安卓手机上运行的,不到15秒的时间执行20步推理,生成了一张512×512像素的图像。这也创造了当时智能手机上最快的推理速度。

你以为这就是手机运行stable diffusion的速度极限了吗?显然不是。在上个月举行的2023骁龙技术峰会上,不到15秒的生成时间又被整整缩短数十倍。高通最新旗舰移动平台第三代骁龙8(以下简称骁龙8 gen 3)让速度飞升成为可能。

在峰会现场,高通用搭载了骁龙 8 gen 3的手机运行相同的stable diffusion大模型,这次不到1秒(0.6秒)的时间便在本地生成了一张图像。从15秒到0.6秒,终端侧生成式ai大模型的进化速度让我们惊叹不已。

这只是高通在本届骁龙技术峰会上展示其终端侧ai能力的牛刀小试。除了生成速度(从 15 秒到 0.6秒)有了质的飞跃,骁龙8 gen 3将支持运行的大模型参数规模(从10亿到百亿)提升一个量级。

大模型赋能平台也不再局限于手机,高通下一代 ai pc 芯片骁龙x elite亮相,将百亿参数大模型「塞进」pc平台,极大拓展了生成式ai应用的广度。

至此,高通在终端侧ai领域积累起来的领导力和技术领先性进一步得到加强,更赋予了手机、pc,甚至耳机等厂商更多终端ai落地的想象力和可能性。

双平台并进,让生成式ai更加触手可及

自今年2月以来,高通先后在搭载第二代骁龙8移动平台的安卓手机上运行stable diffusion、controlnet,让大模型跑在手机端成为现实。此次骁龙峰会上发布的骁龙 8 gen 3 将大模型终端侧落地的潜力提升到了新的高度,使其自身继续在该领域引领潮流。

据了解,骁龙8 gen 3采用的高通ai引擎拥有面向移动终端的强大hexagon npu,集成了升级后的硬件加速单元、微切片推理单元、加强张量、标量和矢量单元,所有单元共享 2 倍带宽的大容量共享内存。同时支持 int8 int16的混合精度以及 int4、int8、int16和fp16的所有精度。性能较前代提升98%,能效提升40%。

骁龙 8 gen 3 集成的高通传感器中枢也更强,拥有2个始终感应isp、2个micro npu和1个dps,内存增加了30%,支持int4精度,ai性能提升了3.5倍。

可以说,骁龙 8 gen 3赋予了手机前所未有的强大终端侧ai性能,成为高通首个专为生成式ai打造的移动平台。那么这款旗舰级移动平台是否名副其实呢?这是我们大家最为关心的问题。

在该平台上,高通ai引擎首次支持多模态生成式ai,包括了多种大语言模型、视觉语言模型等。尤其是在终端侧,骁龙8 gen 3 首次支持运行 100亿参数的模型,规模迈入百亿量级。同时将 stable diffusion 生成图像的时间降到了1秒之内,再次创下最快速度。

在跑meta大语言模型llama2-7b时,骁龙8 gen 3每秒可以生成20个token,同样是手机终端侧最快之一。

(图注)高通产品管理高级副总裁ziad asghar

骁龙平台已经支持运行openai、meta、微软、安卓、stability.ai、bloom、百度、智谱、百川智能、有道等企业或机构的大模型,既为这些厂商将自身大模型能力「下放」到终端侧提供契机,也为用户体验生成式ai带来了丰富的选择项。

牵一发而动全身,随着高通在赋能大模型终端落地上的进一步动作,采用骁龙 8 gen 3移动平台的手机厂商快速跟进,加速了大模型集成到手机的进程。

以首发搭载骁龙 8 gen 3移动平台的小米14系列新机为例,ai大模型技术已经集成到小米全新澎湃 os 中,并上线各种终端侧应用。有了大模型能力加持,小米14 支持了 ai 妙画、ai搜图、ai写真、ai扩图等多项功能,让输入法、wps、相册焕发新的活力。

vivo尊龙凯时入口的旗下品牌iqoo 12系列同样搭载了骁龙8 gen 3移动平台,全新高通ai引擎使其影像体验大幅升级,照片质感和细节拉满。同时该系列手机预装的 originos 4系统引入生成式ai功能,ai助手蓝心小v可以进行超能语义搜索、超能问答、超能写作、超能创图、超能智慧交互,智能化程度明显提升。

此前在骁龙峰会上,荣耀ceo赵明宣布新旗舰手机荣耀magic 6将搭载骁龙8 gen 3移动平台,已支持70亿参数的终端侧ai大模型,为用户提供更加智能化的体验。他在现场演示了终端侧ai进行照片搜索、生成视频等智能操作,效果着实不错。

手机终端融合大模型能力催生了大量或好玩、或有助于提升生产力的生成式 ai应用。未来更加丰富的生成式ai应用会让更多用户切身体验到 ai的魅力,提升自身交互体验,这也正是高通致力于在终端侧打造生成式ai能力的重要源动力之一。

在持续利用ai赋能手机移动平台之外,高通也在寻求利用并把握好大模型及生成式ai的发展契机,以此来重塑pc行业,扩大自身在ai领域的领先优势。

 生成式ai有了「第二阵地」

高通发布了面向pc 平台的全新处理器骁龙x elite,它采用4nm制程工艺,集成定制的高通oryon cpu,运行速度是英特尔 12 核处理器的 2倍,功耗比英特尔竞品低68%,高峰时段的运行速度比苹果m2快了50%。

如果这些参数还无法让你相信骁龙x elite的强悍,那就跑个分吧。骁龙 x elite 拥有两个版本:注重续航表现的 23w 版本、主打性能的 80w版本。geekbench 6测试下的单核和多核得分情况如下图所示,单核性能尤为亮眼。

(图注)图源fonearena

同样地,骁龙x elite专为ai打造。它采用业界领先的、集成高通hexagon npu的高通ai引擎,异构算力高达75tops,hexagon npu算力为45tops,为创意应用、视频会议和生产力助手的变革性体验提供了算力基础。高通 ai引擎还支持了大量的加速应用程序和体验,创造无限可能性。

超强生成式 ai 能力也成为骁龙x elite的一大标签,截止到发布时,它已支持在端侧运行超过130亿参数的生成式ai模型,面向70亿参数大模型每秒生成30个token,ai处理速度是竞品的4.5倍。下图为pc端ai作画能力的展示。

从手机到 pc,多样化的端侧平台为释放生成式 ai能力提供了更多渠道。这也表明,高通在终端侧生成式ai落地这条赛道上继续「加码」,背后既离不开技术上的厚积薄发,也是其在大模型时代自身ai发展战略的延续。

手机、pc加速迎来全新ai时代

在当今大模型时代,终端侧部署生成式ai这条路线越来越明晰。基于此,高通秉持「混合ai是ai的未来」这一理念和战略,注重云端与终端的协同发展,并认为终端侧ai是扩展生成式ai至全球更广泛范围的关键。

遵循这一前瞻性认知,高通一步步积累,逐渐在自身布局中构建了强大、全面的终端侧ai能力,并引领了端侧大模型及生成式ai的革新与进步。毫无疑问,此次骁龙峰会上发布的骁龙 8 gen 3、骁龙x elite将进一步夯实高通作为终端侧ai领导者的地位。

1700120012639500.png

(图注)高通全栈ai优化方案

如果大模型继续保持当前的落地步伐,我们将可以在手机、pc 甚至xr可穿戴设备、智能网联汽车等智能终端上体验到更多生成式ai应用,让人机交互更加自然且个性化。反过来,这些生成式ai应用以及带来的体验变革也将对这些终端设备产生深远影响,甚至改变它们的核心驱动力,重新定义它们。

我们以与人们日常工作、生活息息相关的手机为例,在追求绝对性能之外,人们越来越多地关注一些创意性应用。这就需要ai大显身手,生成式ai性能更是成为下一代手机处理器角逐的核心竞争力。

骁龙移动平台近年来持续发力于此也在意料之中了。从去年的骁龙8 gen 2 到此次骁龙峰会上的骁龙 8 gen 3,ai 早已无处不在,生成式 ai 一跃成为「ai 皇冠上的新明珠」,受到了广泛关注和青睐。

随着大模型及生成式ai在手机终端落地的范围越来越广、成熟度越来越高,我们或许可以看到:传统智能手机被生成式 ai 能力全方位加持的「ai 手机」所取代。小米等手机厂商新发布的旗舰机在这方面已经初具雏形,利用生成式ai增强一些场景的使用体验和效率,为未来颠覆手机的质变做好了充分的量变。

同时,pc 终端的革新也有类似向生成式 ai 能力倾斜的发展趋势。在这方面,集成到windows 中的微软 copilot是一个很好的例证。当然还有更多生成式ai变革人类与 pc 交互的场景和方式,借此实现更高效的智能协作、更简化的工作流程、更强大的生产力、更定制化的使用体验。

骁龙 x elite 一出手便瞄准生成式 ai,势必会为当前的pc市场注入新鲜血液。在第六届虹桥国际经济论坛 ——「智能科技与未来产业发展」分论坛上,高通公司中国区董事长孟樸发表了主题演讲,认为下一代 pc 将进入一个全新的「ai pc」时代,以智能、高性能、高效等为特点, 并将对办公效率等方面产生重要意义。

相信未来高通会在骁龙 8 gen 3 等移动平台和骁龙 x elite等pc平台的基础上,继续加强自身在大模型和生成式ai上的基础能力。加之更多搭载这些平台的厂商发布全新旗舰手机和 pc 产品,他们不断增强的自主性及自研能力可以让我们期待更多样化生成式ai应用的亮相。

不过,在「ai 手机」和「ai pc 时代」真正到来之前,还要看生成式ai能力是否能让用户产生强烈感知、是否能准确满足他们的需求、是否能对相关应用产生依赖性、以及是否能带动他们换机的欲望,这些都是高通和手机厂商现在及未来要考虑的问题。

结语

自发布以来,骁龙 8 gen 3、骁龙x elite展现出的强大生成式ai能力留给人们无限的想象空间。 正如高通公司总裁兼 ceo 安蒙所言,「我们正在进入将改变用户体验的生成式ai时代,也将创造一个移动行业和计算行业的全新周期。」

在这一进程中,作为终端侧领导者的高通正担负起应有的时代角色。一方面,利用自身强大的全栈ai优化能力汇聚软硬件各方,助力终端侧ai生态快速发展;另一方面,全新的跨平台技术「snapdragon seamless」实现安卓、windows 和其他操作系统无缝衔接,这种多终端体验有望将 ai在手机、pc 等终端上的落地进一步拓展开来。

可以预见,基于骁龙生态的ai体验会非常快速铺展开来,各种应用落地的速度也将大大加快。未来,高通将继续保持自身在终端侧ai的技术优势,推动大模型在部署应用时更便捷、更丰富、更有吸引力。同时,携手各大厂商创新基于大模型的生成式ai应用,降低普通用户使用生成式ai的门槛。

随着新的生成式ai时代开启,高通是否能持续满足人们的期待,我想这次骁龙峰会已经给了我们答案。

(文章转载自机器之心公众号)

 

关键词:

图片

精彩推送

金融

财经

要闻

公司

一系列金融支持民营经济、民营企业发展的政策举措正密集出台加速落地。

9月份以来,人民币汇率持续走低。9月8日,离岸人民币对美元汇率盘中最

国家统计局发布的数据显示,8月份,全国居民消费价格指数(cpi)同比上

国家统计局9月9日发布的数据显示,8月全国居民消费价格指数(cpi)同比

今年前8个月,郑州商品交易所累计成交量约25亿手,同比增长64%。这是记

中国电影观众满意度调查2023年暑期档调查结果显示,暑期档电影观众满意

网站地图