作者 | 林晴晴
编辑 | 袁斯来
2022年底,ChatGPT的横空出世,昭示着AI大模型时代已经到来。
AI大模型对各个行业的渗透,刺激了算力市场规模的壮大,我国智能算力更是保持高速增长。据IDC预计,2027年中国智能算力总规模达到1117EFLOPS,智能算力规模年均复合增长33.9%。
AI计算芯片作为支撑算力的核心部件,是云计算产业的算力基石。国内各地近年来数据中心、智能计算中心、超算中心的飞速建设,为AIGC产业的研发及多行业应用提供支撑,也进一步推动了AI芯片的生产和部署。据亿欧智库测算,2025年,中国人工智能核心产业市场规模将达到4000亿元,其中基础层芯片及相关技术的市场规模约1740亿元。
硬氪近期接触的「寒序科技」是一家基于磁计算新范式的算力芯片研发公司,为北京大学物理学院应用磁学中心孵化。该公司近日已连续完成种子轮、种子+轮两轮融资,投资方为零以创投及天使投资人费革胜,源合资本担任财务顾问。
「寒序科技」CEO朱欣岳告诉硬氪,团队依托北大磁学在磁学原理、磁性材料、微纳磁器件拥有数十年沉淀,有望通过微纳加工工艺调控,进行芯片设计、工艺联合优化,将磁存储迭代,发展下一代「磁计算」技术——「磁概率计算」和「磁逻辑计算」。
当前,AI领域不缺算力,而是缺可用易用的算力。朱欣岳认为,「当下,全国各地正迎来新一波建设智算中心的热潮,随着美国出口管制和实体清单限制,发展国内自主可控的新型算力芯片是解决国内AI算力瓶颈的关键。当前AI大模型推理的高带宽算力需求与传统芯片的不匹配的问题愈加剧烈,正呼唤新的计算器件、计算范式的出现。」
针对市场需求,「寒序科技」交出了新的解决方案,推出了概率计算芯片SpinPU-M01,一种基于自旋(Spin)的全新AI算力芯片,其提供的算力可以迅速部署于药物研发、科学计算、航空物流等领域进行专用计算加速;此外,研发磁逻辑计算芯片SpinPU-E系列,采用更低成本的片上MRAM高带宽方案,面向边缘端、云端大模型提供推理算力芯片。
概率计算芯片SpinPU-M01
在芯片材料体系上,「寒序科技」采用并非主流的传统硅基芯片,而是CMOS兼容的磁性芯片。前者虽工艺技术已相对成熟,但先进制程对国内实施封锁,难以获得。而后者由于磁性器件优越特性,可实现大规模片上存储,能提供AI推理所需的超高带宽;其次,磁性芯片的集成度更高,可在有限面积内实现更大规模的存储单元。
对比量子计算,概率计算机不需要接近绝对零度(-273.15℃)的超低温等苛刻条件,它可以在常温下工作,在成本和更大规模计算上优于绝热量子计算,因此更加接近实用。
对比传统算力,在组合优化问题求解中,不同问题规模即不同计算复杂度,当部署于绝热量子计算机、概率计算机后,求解时间尺度将一致。磁计算芯片可在28nm工艺节点下以器件优势、访存速度优势达到同等性能,成本更低,国内工艺即可实现大规模集成。
朱欣岳告诉硬氪,最新产品SpinPU-M01在蛋白质对接的工业级环境测试中,验证了概率计算在加速AI制药方面在可用性测试、稳定性测试和权威数据集测试中的明显优势。相较于2023年Q3发布的主系列性能最高CPU Intel i9-14900k芯片,性能至少提升85.81倍。
核心优势上,朱欣岳认为,「在更大规模比特数的退火机研发上,‘自旋方案’相较于‘超导方案’、‘光子方案‘成本更低、无需超低温、集成度更高,可快速拓展更大比特数的退火机。且相较于量子大型整机设备方案,我们的芯片及加速卡将采用通用PCIe接口,更加易于拓展各地智算中心的云算力和端侧场景的边缘算力。」
硬氪了解到,产品进展方面,「寒序科技」已发布1024概率比特全连接SpinPU-M01芯片及加速卡。
逻辑计算芯片SpinPU-E01概念图
预计2025年,将推出SpinPU-E系列磁逻辑计算芯片,为Transformer架构定制设计,具有低功耗、高带宽、速度快的优势,有望在有限功耗内,适配主流AI模型,完成端侧部署。
据悉,SpinPU-E系列芯片的存储带宽密度和推理能效将直接对标英伟达p00 (TSMC 4nm),峰值算力密度接近英伟达Orin (TSMC 7nm)。