当前位置: 华文世界 > 科技

清华大学研制全球首款大规模光芯片

2024-05-12科技

清华大学研制全球首款大规模光芯片

人工智能技术的发展高度依赖于高性能计算机芯片,对高性能计算机的需求尤为迫切。

OpenAI 首席执行官 Sam Altman 曾多次公开表示,英伟达 p00 和 A100 GPU 目前使用的数据中心效率低下,人工智能需要越来越多的能源,因此需要越来越高的能效。

在这种情况下,光数据处理被视为一项前景广阔的新技术。与传统的电子神经网络相比,光子计算具有速度快、并行性高和功耗低的优点,尤其是在计算高速数据流时。

光子计算机使用光信号而不是传统的电信号进行数据处理,因此在数据处理速度和能源效率方面具有相当大的优势。能源效率的显著提高意味着在计算能力相同或更高的情况下,能源消耗会大大降低,这也是可持续发展的基础。

然而,现有的光学芯片在实现复杂的人工智能任务方面仍存在许多问题,特别是光学神经网络(ONN)在实际应用中存在一些局限性。

光子神经网络是一种将光学和神经网络相结合的新方法,它以光学和光的物理特性(如相干性和衍射)为基础,能够处理复杂的数据。

然而,现有的光子神经网络在实际应用中仍存在一定的局限性,因为它们仅限于基本操作,如识别图像中的简单形状,而无法处理复杂的数据。

为解决上述问题,推动光子神经网络的深入研究,清华大学电子与自动化学院的戴琼海等人合作,自主研发了大规模光子芯片,并在该芯片上构建了拥有1396万个神经元的光子神经网络。相应的研究成果发表在【大型光子芯片 "太一",160- TOPS/W 结构信息】上:"大型光子芯片'太一'实现 160- TOPS/W 能效,助力通用人工智能发展"。

图像 | Tetch 芯片结构图(科学)

太极公司在一块芯片上构建了拥有1396万个神经元的光神经网络,展示了其在小型化和集成化方面的巨大优势,是光计算机系统处理能力和效率的重大突破。该项目的研究成果将为复杂数据处理、大数据分析、实时决策等领域提供重要的理论和技术支持。

然而,仅仅通过扩大光子网络或在光芯片上增加光子设备(如调制器、探测器等),是不可能实现大规模高能效光子数据处理的。这种简单的扩展并不能直接提高性能。网络规模的扩大往往会导致管理复杂性和噪声的增加。

在光子网络中,信号会在各层产生噪声,这些噪声会在各层累积。在多层网络中,整体噪声水平会急剧增加,从而对系统的性能和可靠性产生重大影响。

这项研究的成果是什么?该项目提出了一种基于分布式衍射干涉的新型光子计算框架,可将网络中的神经元数量大幅增加到数百万个数量级,能效达到 160 兆次/瓦。

图片 | TECH 晶圆的包装和测试(来源:【科学】杂志)

该算法将集群集中在特定的子任务上,从而实现资源的优化分配,并根据不同的任务分配子任务。在处理完每个子任务后,这些单独的进程被整合到最终的高层任务中。在此基础上,提出了一种基于分布式数据结构的并行多任务处理方法。

在对 Big Pool 芯片性能的测试中,我们用 Omniglot 数据库对算法进行了验证,在 1000 个类别级别上的准确率达到了 91.89%。这表明 Big Pool 能够高效、准确地处理复杂的分类问题。在无人驾驶汽车和实时视频分析等领域,直接实现高准确率和高效率的分类是一个关键问题。这意味着光子计算未来有可能解决更复杂的人工智能任务。

此外,Taichi 在自动生成的人工智能内容方面表现出色,计算效率几乎比传统算法高出两个数量级。这意味着,这款芯片不仅可以执行复杂的人工智能计算,还能生成高质量的视频,同时大幅降低所需的计算速度和功耗。"太一 "芯片以其新颖的设计和出色的性能,展示了光学计算技术在人工智能领域未来广泛应用的前景。

本项目的研究成果将推动光数据处理领域的发展,有望突破传统数据处理方法在处理大规模、高复杂度任务方面的瓶颈。同时,本项目的研究成果也将为相关光电子器件的研发提供新的思路,促进光电子器件的发展,提高产业的效率和经济性。

该项目的研究成果将为光计算的实际应用性、规模和实用性奠定基础。随着人工智能技术的发展,面临着海量数据规模和复杂度不断提高的挑战,光计算技术以其计算机科学、高速度和低功耗的独特优势,有望为优化此类要求苛刻的计算过程提供全新的思路,大大提高模型训练和机器学习等领域的性能。

尽管光子芯片仍面临许多处理和集成问题,但总体而言,光子计算是满足当前人工智能领域日益增长的性能和效率要求的有效途径。随着工艺的不断改进和价格的不断下降,光子计算将代表一场新的计算革命。

另请参见

Https://www.science.org/doi/10.1126/science.adl1203