送设计 保质量 高品质
当前位置:官网首页 > 新闻资讯 > 公司新闻 >

103亿晶体管,4.7倍AI算力,华为发布全球最强5G芯片麒麟990,月底登陆Mate30

文章出处: 发表时间:2019-09-11

三星称,猎户座 980 不仅支持 Sub-6GHz 的 5G 网络,还支持 5G 毫米波频段。在 Sub-6GHz 频段,最高下行速率可达 2.55Gbps,最高上行速率达 1.28Gbps。但这一下载速率也引发了华为手机产品线副总裁李小龙的质疑。


不过这颗猎户座将于今年年底开始批量生产,落地到 5G 终端上的时间尚不明确,到底谁会是最先落地的 5G 芯片?


103 亿晶体管:你能买到的最强芯片


麒麟 990 芯片的尺寸比上一代 980 还要小,然而却集成了多达 103 亿个晶体管——比去年麒麟 980 的晶体管数量多出了近 50%,这一数量也让它成为了目前手机上晶体管数量最高的芯片。


如此强大的算力,不仅是为了提升 AI 性能,也是为了能够塞进 5G 基带,并尽可能的降低功耗。艾伟表示此前麒麟 980+巴龙 5000,以及高通的骁龙 855+X55 外挂 5G 解决方案的推出说明计算芯片和通信芯片两边的技术都已解决。但若想降低功耗,则必须要使用更为先进的制程工艺。


「上一代的麒麟 980 有 69 亿晶体管,麒麟 990 已有 103 亿晶体管。对于 5G 通信,问题在于怎样在不影响功耗的基础上解决问题。在这里如果效率不够高,晶体管数量还会更多,」艾伟表示。「而我们目前看到的很多 5G 芯片规格都不是旗舰机的规格,旗舰机用旧的工艺是支撑不了的。」



在芯片制程上,去年台积电就量产了 7nm 工艺,并已在苹果 A12、麒麟 980 等芯片上应用,相比之前的 10nm 工艺有了较大提升。但第一代 7 纳米工艺并没有使用 EUV 光刻机,在今年量产的第二代 7nm EUV 工艺上,华为麒麟再次抢占了首发位置。



这也就是为什么麒麟 990 在没有使用最新 Arm 内核的情况下还提升了性能的原因:麒麟 990 上的 CPU、GPU 型号依然沿用了 Cortex A76 和 Mali-G76,呈 2 大核+2 中核+4 小核设计,最高主频可达 2.86GHz。与业界主流旗舰芯片相比,麒麟 990 的单核性能高 10%,多核性能高 9%。能效方面针对不同大小的核精细调校,大核能效优 12%,中核能效优 35%,小核能效优 15%。


麒麟 990 5G 搭载的 16 核 Mali-G76 GPU,与业界主流旗舰芯片相比,图形处理性能高 6%,能效优 20%。全新系统级 Smart Cache 分流,支持智能分配 DDR 数据,在重载游戏等大带宽场景下带宽较上一代最高可节省 15%,功耗可降低 12%,进一步提升 GPU 能效。


「昨天,我看到了友商发布了一款 PPT 芯片,」余承东说道。「他们的 GPU只有 5 核,我们的手机芯片是旗舰机的。」



拍照一直是华为手机领先的领域,麒麟 990 搭载了全新 Kirin ISP 5.0,全球首发手机端 BM3D专业图像降噪技术。据余承东介绍,这是一种业内领先的图像降噪算法,此前主要被应用在单反相机上——从未出现在手机上。


「为什么其他厂家想不到?这主要是能力问题,」艾伟表示。「手机摄像头天生比单反相机的感光面积小,所以我们要必须使用专有的算法,并控制功耗,同时避免成像时间太长。麒麟 990 全球首发的双域联合视频降噪技术,在空域视频降噪和时域降噪之外,又加入了频域降噪技术。几种方法叠加起来,我们获得了更好的效果。」


自 2017 年起,华为接连推出了全球首款搭载 AI 处理器的手机芯片麒麟 970,首款搭载双核 NPU 的麒麟 980,一直引领着旗舰手机处理器的创新之路。值得一提的是,华为这次还为来到发布会现场的每个人发了一本新书《熵减:华为活力之源》,其中首次披露了华为麒麟系列芯片的研发历程。


中美贸易战对于华为的芯片研发也有很大影响。前不久,在华为 8 月 23 日发布升腾 910 芯片的活动中,徐直军就曾表示华为已经与三家 EDA 公司 Synopsys、Cadence、Mentor 停止了合作。接下来华为的芯片设计软件将会转向哪家?在活动中,艾伟表示:未来我们会自己做。


达芬奇NPU双大核+微核架构


麒麟 990 首次在华为旗舰手机芯片中采用了自研的 NPU,而且这次还采用了两个大核一个小核的新设计,华为表示这是为了更为贴近手机的日常使用,为减小功耗而设计。通常,小核可以用来承载智能语音唤醒、语音识别、人脸解锁等任务的计算任务,同时也可以负责唤醒大核,并可以和大核共同进行 AI 任务计算。




在人脸识别的应用场景下,NPU 微核的能效可达大核的 24 倍,让 AI 运算更省电。华为表示采用这种设计,手机每天的耗电量可以减少 5%。




华为表示,新的 NPU 性能在 AI 算力上已经比麒麟 970 提升了 12 倍,比麒麟 980 提升了 1.88 倍。毫无疑问这是目前手机上最强的 AI 算力了。如此强大的算力可以支持实时的图像多实例分割:为多人物背景替换等应用。


在双大核 NPU的加持下,麒麟 990 5G 与业界其他旗舰 AI 芯片相比,性能优势高达 6 倍,能效优势高达 8 倍。无论是在业界典型的中载神经网络模型 ResNet50,还是在移动端更流行的轻载神经网络模型 MobilenetV1下,麒麟 990 5G 的 FP16 和 int8 性能和能效均达到业界最佳水平。


「达芬奇」是华为近期推出的神经网络处理单元新架构,最早出现于今年 7 月随荣耀 9X 推出的麒麟 810 手机芯片上,随后又出现于今年 8 月的服务器级 AI 芯片昇腾 910 上。达芬奇架是在 Arm 架构基础之上研发的 AI 硬件处理单元,其 AI 加速器采用了创新的 3D Cube 针对矩阵运算进行加速,大幅提升了单位功耗下的 AI 算力。


具体来说,达芬奇 NPU 的每个 AI Core 可以在一个时钟周期内实现 4096 个 MAC 操作,相比传统的 CPU 和 GPU 实现数量级的提升。


3D Cube


目前常见的 AI 计算,其核心是矩阵乘法运算,计算时由左矩阵的一行和右矩阵的一列相乘,每个元素相乘之后的和输出到结果矩阵。在此计算过程中,标量、向量、矩阵算力密度依次增加,对硬件的 AI 运算能力不断提出更高要求。


典型的神经网络模型计算量都非常大,这其中 99% 的计算都需要用到矩阵乘,也就是说,如果提高矩阵乘的运算效率,就能最大程度上提升 AI 算力——这也是达芬奇架构设计的核心:以最小的计算代价增加矩阵乘的算力,实现更高的 AI 能效。


同时,为了提升 AI 计算的完备性和不同场景的计算效率,达芬奇架构还集成了向量、标量、硬件加速器等多种计算单元。同时支持多种精度计算,支撑训练和推理两种场景的数据精度要求,实现 AI 的全场景需求覆盖。


在苏黎世理工推出的 AI Benchmark 上,麒麟 990 也获得了非常高的分数——超越此前最高的麒麟 810 接近一倍:


推荐产品

友情链接