当前位置: 华文世界 > 手机

细说高通骁龙8 Gen 3 AI引擎

2024-06-03手机

骁龙8 Gen 3是高通公司发布的一款高端移动处理平台,正式发布于2023年10月25日的美国夏威夷骁龙峰会。作为骁龙系列的最新产品,骁龙8 Gen 3旨在成为2024年安卓旗舰智能手机的标配处理器。除了大家熟知的CPU和GPU,该芯片还集成了两个AI Engine增强功能:

【1】Qualcomm® Hexagon™ NPU

Hexagon NPU前身为Hexagon DSP(数字信号处理器) ,用于处理复杂的数字信号处理任务,如音频、视频、语音和传感器数据处理等

2007年, Hexagon DSP 首次在 骁龙芯片中出现

2015年,骁龙820处理器集成 首个高通 AI 引擎 ,支持成像、音频和传感器运算。

2018年,高通在骁龙855中为 Hexagon NPU 增加了 Hexagon 张量加速器。

2019年,高通在骁 龙865上扩展了终端侧 AI 用例,包括 AI 成像、 AI 视频、 AI 语音和始终在线的感知功能。

2020年,高通凭借 Hexagon NPU 变革性的架构更新 ,实现了重要里程碑,融合标量、向量和张量加速器,带来了更佳性能和能效,同时还为加速器打造了专用大共享内存,让共享和迁移数据更加高效。

2022年,第二代骁龙8中的 Hexagon NPU 引入了众多重要技术提升(专用电源传输轨道、微切片推理、本地4位整数(INT4)运算、Transformer 网络加速等等)

2023年,第三代骁龙8中的 Hexagon NPU 是高通面向生成式 AI 最新、也是目前最好的设计,支持所有运算精度 (INT4, INT8, INT16, FP16) 为持续 AI 推理带来98%性能提升和40%能效提升 。它包括了跨整个 NPU 的微架构升级。微切片推理进一步升级,以支持更高效的生成式 AI 处理,并降低内存带宽占用。此外, Hexagon 张量加速器增加了独立的电源传输轨道,让需要不同标量、向量和张量处理规模的 AI 模型能够实现最高性能和效率。大共享内存的带宽也增加了一倍。

【2】 Qualcomm® Sensing Hub

Sensing Hub 是高通公司开发的一种低功耗传感器处理单元,它集成在高通骁龙移动平台中。Sensing Hub 的主要目的是在低功耗状态下持续运行,处理来自各种传感器的数据,从而支持智能手机和其它设备中的始终在线的传感器应用。

低功耗运行 : Sensing Hub 能够在极低的功耗下运行,使得设备可以持续监控传感器数据而不会显著消耗电池。

集成传感器处理 : 它集成了对多种传感器的支持,包括运动传感器、环境光传感器、接近传感器等。

AI 优化 : Sensing Hub 通常与高通的 AI 引擎配合使用,提供高效的 AI 处理能力,用于小型神经网络和特定应用,例如上下文感知和音频处理。

始终在线的摄像头支持 : 在某些骁龙平台中,Sensing Hub 支持始终在线的前置摄像头,用于快速面部解锁等功能。

音频处理 : Sensing Hub 包含双 AI 音频处理器,可以支持始终感知的摄像头和音频功能,提供更好的音频体验。

在2023年骁龙峰会上,高通演示过两个生成式 AI 应用,展示了面向大语言模型和大视觉模型通用架构的真实应用性能。在第三代骁龙8上,个人助手演示能够以高达 每秒20个 tokens 的速度运行 Llama 2-7B 。在不损失太多精度的情况下, Fast Stable Diffusion 能够在 0.6秒内生成一张512x512分辨率的图像 。高通有着智能手机领域领先的 Llama 和 Stable Diffusion 模型指标。

资料来源:高通官网【通过 NPU 和异构计算开启终端侧生成式 AI】 白皮书