天玑9000性能提升多吗?

机选网 天玑9000
型号 机选网
制造工艺 4nm
架构

1*3.0GHz X2超大核

3*2.85GHz大核

4*1.8GHz小核

GPU Mali-G77 MC9

按照惯例,先来看看天玑9000的一些基本参数:

制造工艺:TSMC 4nm;

CPU:1x Cortex-X2 3.05GHz + 3x Cortex-A710 2.85GHz + 4x Cortex-A510 1.8GHz;

GPU:Mali-G710 MC10;

AI处理器(APU):4x performance core + 2x flexible core;

ISP:Imagiq Gen 7,最高支持9 GigaPixel/s吞吐,3.2亿像素摄像头;3-core 3-exp HDR-ISP(3个3200像素摄像头支持,整个系统270fps的处理能力,18bit管线);4K 3-exp视频HDR支持;AI-Video架构;

视频与显示:8K视频编解码器,支持8K AV1视频播放;显示输出支持最高WQHD+ @144Hz/FHP+ @180Hz,HDR10+ Adaptive支持;

Modem:5G Rel.16,支持下行载波聚合3CC最高300MHz频宽(3x100MHz)、7Gbps速率;上行R16 UL增强;UltraSave 2.0节电特性支持;

其他连接:WiFi 6E(6GHz);蓝牙5.3;完整的GNSS支持;

内存支持:LPDDR5x-7500;

这其中有很多个“全球首发”,包括首个采用TSMC 4nm制造工艺,首个采用Cortex-X2 IP,首个采用Mali-G710 IP,首个支持LPDDR5x 7500,首个3.2亿像素摄像头支持,首个3-cam 3-exp 18bit HDR,首个8K AV1视频播放支持,首个5G下行3CC载波聚合300MHz 7Gbps实现,首个R16 UL Enhancement支持,智能手机上首个支持蓝牙5.3。

从整体来看,这个时间节点下,其中的大部分配置都还是相当豪华的,起码天玑9000的旗舰定位是没有疑问的。针对其中的各组成部分,我们再剖开来谈一谈。

CPU部分:首个Armv9实现

从发布时间来看,这的确是市面上最早宣布的采用Armv9指令集的处理器。

有关Cortex-X2/A710/A510的分析,我们已经在此前的文章里做过详述。

这三个IP是今年年中Arm面向大众发布的,其亮点在于都基于Armv9指令集,而且基本切断了对32位AArch32执行模式的支持(除了为考虑中国市场的Cortex-A710之外)。

1+3+4的配置,从此前的Cortex-X1开始就比较常见了。

Arm说Cortex-X2在IPC上相比X1提升了16%;而A710相比前代Cortex-A78的同频性能提升最高10%(且同等性能下功耗降低30%);小核心A510的改进应该是最大的,相比年迈的A55有35-50%的性能提升,峰值性能下有20%的功耗红利。

有关CPU核心更具体的架构变化,此处不再多做赘述。

尤为值得一提的是天玑9000在CPU缓存方面的提升:L3 cache容量增大至8MB,而在整个SoC上面向几个主要IP的SLC(system level cache)容量增长至6MB。

所以联发科在发布会上宣称,移动CPU架构的cache达成了“PC级cache设计”,达到了“14MB”——虽然我们感觉把L3 cache和SLC加起来还是挺奇怪的。

这个容量变化其实并不让人意外,此前Arm在发布Cortex-X2的时候,推荐的L3 cache就是8MB。

而且我们在分析文章里也提到过,8MB L3 cache是这次Arm新IP实现性能提升的关键。

6MB SLC在Android阵营里是比较大的。

相对来说,高通骁龙888的L3 cache是4MB,SLC则为3MB。不过和苹果还是不大能比(A15的SLC达到了32MB)。

联发科方面说14MB的cache系统,对性能提升最多能起到7%的帮助作用,而且能够降低带宽消耗25%。

宣传上,联发科还特别将14MB这个容量和Intel酷睿处理器(面向笔记本)作了比较,如上图所示。

如果是11代酷睿的话,这里列出的i7处理器12MB cache应该是指LLC(具体是L3 cache)。

这个对比实际上没那么公平,意义也不大:一方面在于Intel酷睿处理器的L2 cache其实会更大,另一方面x86平台的cache系统在设计上和Arm阵营不是一回事,比如L3 cache在系统中扮演的角色就不一样(x86这边也没有SLC),再比如x86这边在L1 cache也不可能像当代Arm那样做得那么大。

此外,天玑9000的Cortex-X2大核L2 cache也选配了1MB,A710的L2 cache为512KB,这都是Arm官方推荐的配置更大档位的方案,也能说明天玑9000的旗舰定位。

联发科提到,天玑9000“相比现在的Android旗舰,峰值性能提升最高35%”,“与此同时能效提升至多37%”——这一点主要说的是Cortex-X2。

这个说法还是比较模糊,具体对比对象不明。

感觉综合4nm的工艺红利,和Cortex-X2的架构提升,相比X1还是很难达成35%的性能提升。

联发科给了具体的基准测试比较。这里35%是基于SPECint2K6的测试,系统级的性能提升。

在核心级别上,Geekbench 5.0测得天玑9000单核性能提升为10%。

作为对比,Arm此前在发布会上提过,Cortex-X2基于SPECint2K6测试,相比X1,IPC提升最多16%。

所以天玑9000的具体实现相当值得做后续观察。

当然我们不清楚此处联发科具体对比的是谁。

CPU多核性能方面联发科表示天玑9000在Geekbench 5.0中的跑分超过4000分。

上面这张图除了对比“Android旗舰”以外,中间两个“2021旗舰”和“2020旗舰”代表的应该是iPhone(因为发言人在演讲中说So we compare not just to the Android flagship today, we also compared to the non-Android phones which is 2020 version and 2021 version which is made by the Cupertino company.)

这样的表现的确不错,不过苹果A系列的强项实际上主要在单核性能上;而且请注意采用天玑9000的手机是明年才要正式上市的。

但另一方面,比所谓今年的“Android旗舰”在跑分上高出这么多,的确也是相当出彩的成绩了。

实际体验方面,联发科给了不同app在天玑9000平台之下的启动时间,与“Android旗舰”的速度对比。其中Netflix开启时间快了55%,一些重型负载如游戏应用的开启速度提升幅度也在12%-50%区间。

GPU:好像支持光追

GPU方面,天玑9000选择的Mali-G710是10核心。事实上,Arm在发布Mali-G710的时候提及可配置的shader核心数在7-16个。

具体表现如何,还是要看将来产品发布时,核心频率等各方面的因素(LPDDR5x 7500支持在此应该会有帮助)。

前文未提及的一点是,联发科在会上稍稍提天玑9000“实施了光线追踪特性,把PC级的游戏体验带到移动端”,但再未谈及更多信息。

前不久联发科召开的媒体分享会上,提到过光线追踪实施的进展。

不过据我们所知,Mali-G710并没有硬件级的光线追踪支持——起码其中还没有光追的专用加速硬件。

我们猜测天玑9000基于Vulkan API的光线追踪支持,仍然是软件级的。

但联发科此前谈到过,已经在硬件层面开始布局对未来最终光追硬件实现的逐步支持(比如cache/buffer之类,猜想天玑9000也是联发科通往完整光追硬件支持的重要一步。

性能提升方面,联发科表示天玑9000的Mali-G710 GPU相比2021的“Android旗舰”有最多35%性能领先,能效则最多有60%的优势。对比对象不明确,无法做出确切判断。

在具体的持续游戏性能上,联发科给了上面这张图。

这张图测试的是对某款“流行的沙盒游戏”在60fps设定、5G网络开启的情况下,持续玩24分钟,帧率上的变化情况。注意这张图的对比对象可能是iPhone 13,而联发科也在会上提到对比的游戏就是《原神》。

从这张图可见,天玑9000的游戏帧率会更为平稳,受发热限制可坚持的帧率也会略高。

不过这种对比其实更考验的是系统性能,包括OEM厂商的散热设计在其中占到的比重会非常大。

更多类型的游戏比较如上图,这里的“2021旗舰”看起来相当奇怪......不过若主流游戏都可满帧跑(而且是平均帧率),不管竞品是谁,天玑9000对手游爱好者而言的确是相当值得期待的。

这部分另外值得一提的是天玑9000对于LPDDR5x 7500MT/s的支持。

联发科提到LPDDR5x 7500相比LPDDR5 5500,能够将带宽提升36%,在重度负载下让延迟降低20%。

去年和今年的旗舰手机的确大多都在用LPDDR5。

LPDDR5x还是相当新的方案,本月月初三星才刚刚宣布开发出了首个14nm 16Gb的LPDDR5x DRAM。

此前三星给的数字是相比LPDDR5实现1.3倍处理速度提升,以及将近20%的功耗降低。

这几天,美光也刚刚宣布联发科验证了其LPDDR5x DRAM,针对的就是天玑9000。

美光给的数字是LPDDR5x峰值8.544Gb/s,相比LPDDR5提升至多33%的性能。

LPDDR5x的采用,理论上应该也是游戏帧率得到提升的部分原因。

AI性能:比比苹果和谷歌

当代手机SoC不能忽略的另一个亮点自然就是AI专核了,联发科将自家的AI专核称为APU。

这也是联发科自研IP的重要组成部分,或者说APU已经成为如今联发科在手机SoC市场上实现差异化竞争的关键。

前不久的媒体分享会报道中,我们也特别提到了联发科对AI的看法,以及联发科提出的以“每瓦有效算力”来评判AI处理器的性能和效率,建议关注端侧AI inference的各位前往阅读。

这次天玑9000之中的APU采用4个性能核(Performance Core),加两个弹性核(Flexible Core),简单理解应该就是4大核、2小核的设计。上一代产品中,联发科用的是2大核+3小核方案。所以联发科宣称天玑9000在AI性能上提升了多达400%,与此同时能效(Power Efficiency)也提升了4倍。

似乎大部分端侧AI芯片或IP供应商对于自家芯片架构都甚少提及,联发科也没有在会上去谈自家APU的架构。

相比“2021旗舰”(这里应该又是指iPhone-by Cupertino company),AI性能领先66%,能效则有31%的优势。以下是跑具体的一些应用和NN时的对比:

对象检测和图片分类的确都是手机上比较具有代表性的AI应用场景,跑的是MobileDet、MobileNet V3、V2网络。

除此之外,联发科还特别将天玑9000的APU和谷歌发布没多久的Pixel 6手机之上的Tensor处理器作了比较。对比的是AI ETHZ v4——苏黎世联邦理工学院的AI Benchmark,在业界也颇具名声。

联发科表示,天玑9000相比Tensor,在AI性能上有至多16%的性能领先。

更具体的一些对比项目如上图,项目包括视频AI降噪、去模糊等。

ISP、媒体与显示

而在手机SoC之上,除了CPU、GPU和AI专核这几大件之外,芯片厂商普遍强调的还有ISP(图像处理器),毕竟影像性能可是下游手机产品的宣传重点。天玑9000也不例外。

天玑9000之上的ISP是联发科的第七代Imagiq。联发科称其为全球首个3.2亿像素支持的ISP,吞吐9 GigaPixel/s。这次的新ISP据说相比上一代,是全新设计的架构(completely re-design on the pipeline)。

在吞吐上这一代ISP相比前代提升2倍,视频降噪性能10倍提升。

视频拍摄支持方面包括4K HDR拍摄,还有个AI-Video架构。

这次的ISP是个3核(3 ISPs)设计,每个ISP(核)可处理3-exposure图片(应该是指3次不同曝光的帧或画面)。那么到视频拍摄上,就能够以HDR的方式同时捕捉3-exposure 18bit的视频(联发科表示,Imagiq Gen 7是全球首个能够在ISP管线上实施18bit的方案)。联发科称其为全球首个实现硬件级的3-cam 3-exp 18-bit video HDR支持,3个ISP(核)一起工作的话,就是每秒处理270帧画面。

对于所谓的3 exposure,联发科还在会上将其与2 exposure的方案作了对比。

联发科表示,3 exposure输出的18bit HDR画面更加接近人眼动态范围(这个对比应该是指,视频拍摄的每一帧,都以三次曝光执行HDR合成)。

当然,ISP与AI的合作是现在的手机SoC芯片厂商普遍在做的事情了。

毕竟AI在影像拍摄过程中正扮演越来越重要的角色。前文提到的AI-Video架构应该就是联发科的方案。

天玑9000主要强调的是有个VSE(视频流引擎)——这是架构层面的改进,“融合ISP与APU的流处理”,“视频拍摄或大型照片处理时,不需要再频繁通过DRAM来交换数据”。

联发科针对这个VSE并未提供更多信息,可能和增大片内cache有关。此前,我们在《手机拍照:在AI面前,1亿像素都是垃圾》一文中谈到过,麒麟9000采用一种Smart Cache,以及帧切片的方式实现ISP与NPU的数据互通,避免数据频繁通过片外存储来读写。猜测VSE可能与此会比较类似。

联发科表示,VSE能够将功耗降低至多17%,延迟减少至多33ms,如此一来也就能进行更多特性的视频实时录制和处理。

这样的算力与架构,是实现照片与视频拍摄质量的基础。不过影像内容创作,就ISP层面更重要的还在于OEM厂商所采用的算法。

在内容呈现上,关乎到SoC之上显示与媒体/视频编解码模块。

视频方面,天玑9000支持8K视频编解码,其中包括8K AV1格式的视频播放。对此联发科表示现如今很多视频流服务都升级到了AV1。

所以将其固化为一个模块也是必然的。

显示方面,天玑9000支持最高144Hz刷新率2K分辨率屏幕,或180Hz的全高清分辨率屏幕显示,以及对HDR10+ Adaptive提供支持。

谈谈5G modem和天玑9000的低功耗

在连接(Connectivity)支持上,天玑9000将WiFi支持的频宽翻倍至160MHz。

这次对WiFi 6E的支持,应该是真正能够发挥160MHz频宽的组成部分。另外天玑9000是智能手机中首个实现蓝牙5.3支持的芯片——估计对用户而言,蓝牙耳机降低延迟是其更有价值的一个应用场景。

无线连接的5G支持方面,这次的天玑9000虽然仍然不支持毫米波,但开始支持sub-6GHz下行的3CC载波聚合,频宽300MHz最高带宽7Gbps——今年9月份,是德科技就发布消息提到过和联发科在这方面的合作,即在sub-6GHz范围内,聚合3个5G NR载波达成300MHz频宽。

此外还有对于更多5G Rel-16特性的支持,包括“全球首个R16 UL Enhancement”,相比Rel-15在弱信号区域的上行速度能够提升最高3倍。这些特性都是联发科技术投入上的重要组成部分。

对于5G支持,联发科另一个强调的重点是持续加强UltraSave技术。天玑9000采用的是迭代版的UltraSave 2.0。

联发科表示,相比“2021旗舰”(iPhone),在Connected模式下功耗降低至多32%,High Speed模式下功耗降低至多27%。

这里的High Speed模式,在联发科的定义里似乎在于视频流这类持续高速使用5G流量的典型应用中。具体如何实现节电的,联发科在发布会上并没有提到。

谈到低功耗,这次联发科CEO Rick Tsai演讲中多次提到了联发科对于“低功耗”的看重,讲话开头、中间和结尾都不忘提“低功耗”,并强调在技术上要从低功耗走向高性能,难度会显著地低于从高性能走进低功耗。联发科的主场毕竟在边缘和端侧设备上,IoT也是其重要市场,追逐低功耗也是应该的。

针对天玑9000,联发科表示:我们采用新的技术,新的低功耗架构,将功耗控制到最低级别。

上图的这组对比,比较的也是“Android旗舰”。

具体的场景包括了飞行模式、空闲模式、音乐播放、8K视频播放、4K视频录制、游戏等。不同场景下,天玑9000可实现的功耗相比竞品有不同程度的优势。不过类似8K视频播放这种场景,大约和新加的解码模块有关吧。

而且联发科如今造旗舰手机SoC芯片有个特别的优势,就是台积电在工艺上会显著的更为成熟。

N4虽然不是什么大版本迭代,但台积电在规划上会将其列为主流SoC的重要制造工艺。这一点此前探讨工艺的文章里也已经介绍过。

而三星4LPE实际上可能存在更大的不确定性,因为4LPE目前是作为7LPP之后的完整迭代,包含了pitch scaling的。这会成为明年与高通的竞争中,联发科的一个重要优势项。

手机SoC是其他业务的重要驱动力

天玑9000无疑肩负着联发科全面征服高端手机市场的使命,所以联发科在其中倾注了很多的技术与心血。而且此前的媒体沟通会也能清晰地看到,联发科在技术上的持续投入,以及未来手机芯片方面的规划路线,包括5G、AI、图形、图像各方面的技术,此前我们都解读过。似乎也是从这几年开始,联发科在技术上的投入和合作也显得明显更为积极。这是将市场扩张至旗舰设备的关键。我们也期待看到明年天玑9000发布之后,市场交付的答卷。

比较有趣的是,这次发布会Q&A环节,不少人问及联发科未来业务的发展重点,以及在手机之外其他业务的投入情况。Joe Chen和Rick Tsai对此的解释是,联发科的其他业务增长点此前就已经开始显现:虽然手机芯片业务的增长仍然是最快的,但其他各组成部分的同比增长也都有百分之三四十。

更重要的是,手机旗舰SoC“是我们的技术驱动力”,联发科在手机上的很多技术储备,正以更快的速度流向其他应用和市场。包括“我们先进工艺技术、先进封装技术方面的能力,也在其他计算业务上发挥作用”。这也为联发科发展创造了更多的机会。