要点:
中国清华大学研发的“太极”二代芯片近日再突破,不仅展示了中国在智能光计算技术上的领先地位,还有效绕过了西方对GPU的封锁。
科技正以前所未有的速度和规模发展,引发多个领域的变革,塑造了新的商业模式,甚至重塑了全新社会结构。我们一起,从科技创新中洞察社会转型和升级的机遇。
狂呼科技研究所聚焦科技创新对当今世界的影响,以独特、前瞻的科技视角,洞察科技时代下涌现的“创新革命”。
狂呼,以最具突破性的技术塑造我们的未来,为大众捕捉科技商业先机,探索当今人类社会面临的重大挑战。
联系我们// 相关文章
近年来,西方国家对中国高科技领域,尤其是芯片产业,实施了严格的出口管制措施。美国政府不断收紧对高性能GPU的出口限制,并对中国科技企业实施制裁,旨在减缓中国在人工智能领域的前进之路。然而,中国“太极”二代微晶片的问世却打破了这一局面。
近期,清华大学电子工程系副教授方璐及其课题组成员,与中国工程院院士、清华大学自动化系戴琼海院士的团队,组成了一个跨学科研究团队,在智能光计算芯片领域取得了重大突破。
团队以周易典籍“易有太极,是生两仪”为启发,建立干涉—衍射联合传播模型,融合衍射光计算大规模并行优势与干涉光计算灵活重构特性,将衍射编解码与干涉特征计算进行部分/整体重构复用,以时序复用突破通量瓶颈,自底向上支撑分布式广度光计算架构,为片上大规模通用智能光计算探索了新路径。
“太极”二代芯片诞生之路<br data-mce-fragment="1">光学计算利用光而不是电来处理讯息,长期以来一直被誉为传统电子计算机的有前途的替代品。就像光纤电缆比铜线更快地传输资料一样,光学计算机有潜力以更高的速度执行计算,同时消耗更少的能量。
然而,训练这些光学系统一直是一项重大挑战。此前,研究人员必须依靠电脑模拟来设计和优化光学神经网络,类似于建筑师在施工前使用电脑模型来设计建筑物的方式。这种方法通常不准确且效率低下,因为模拟无法完美地解释光学系统中现实世界的缺陷。
此外,与模型推理(使用人工智能AI模型执行任务)相比,模型训练需要大量的运算能力。然而,目前的光学神经网路训练严重依赖GPU进行离线建模,并且需要物理系统的精确对准。因此,光学训练的规模面临巨大的限制,光学高效能运算的优势似乎受到了无形的限制。
新的FFM学习方法透过让光学系统即时学习和自我调整来解决这个问题,就像自动驾驶汽车不断适应路况一样。这种现场学习方法消除了复杂模拟的需要,并允许系统解释其自身独特的“怪癖”和缺陷。
清华大学的研究人员透过几个令人印象深刻的实验展示了他们新技术的威力。首先,他们创建了一个深度光学神经网络,能够以与传统电脑系统相当的精度识别影像。这类似于教相机像人类一样识别物体,但仅使用光学元件。
随后团队开发了一种成像系统,可以将以前所未有的清晰度透过散射材料(如雾或毛玻璃)进行观察。这项技术有可能用于提高自动驾驶汽车在恶劣天气条件下的能见度或增强医学影像技术。此外,他们还展示了一种“全光学”系统,能够使用极低的光照水平(相当于每个像素不到一个光子)处理资讯。
最后,研究人员基于这种FFM学习方法设计了一个光学微晶片,称为“Taichi II”/太极二代,希望取代目前使用的GPU,显著提高AI系统的训练效率。
与传统的深度计算层层堆叠的方法不同,“太极”二代芯片通过将复杂的智能任务简化为多个并行处理的子任务,并为每个子任务单独配置计算资源,从而实现了高效处理复杂任务。
团队首创了干涉-衍射分布式广度光计算架构,研发了全球首款大规模通用智能光计算芯片“太极”/Taichi。该芯片的系统级能效达到每秒每焦耳160万亿次运算,比主流商用AI芯片高出三个数量级,为后摩尔时代的高性能智能计算开辟了新路径。
“太极”二代芯片首次实现了对超过1000个类别自然场景图像的智能光计算分类,并支持跨模态内容生成等任务,为AI大模型、智能无人系统和通用人工智能/AGI提供了强大的算力支持。
从“太极”一代到二代的演变
4月12日,清华大学电子工程系方璐课题组、信息科学技术学院院长戴琼海院士课题组,摒弃了传统电子深度计算范式,构建了智能光计算的通用传播模型,首创了名为Taichi(意为“太极”)的干涉—衍射分布式广度光计算架构。基于此创新架构,课题组进一步探索干涉光与衍射光的优势特性,又研制出干涉—衍射异构集成智能光计算芯片,可实现每秒每焦耳160万亿次运算的通用智能计算。
以光波为载体进行智能计算,具备高速、低功耗等特性。然而,现有智能光计算局限于简单的字符分类、图像处理等。其痛点是光的高性能计算潜力受困于电子计算架构,计算规模受限,无法支撑亟须高算力与高能效的复杂大模型智能计算。
直面科研领域痛点问题,清华大学团队帮助光计算“挣脱”算力瓶颈,另辟蹊径,“从0到1”重新设计适合光计算的新架构。相异于电子神经网络依赖网络深度以实现复杂的计算与功能,“太极”光芯片架构源自光计算独特的'全连接'与'高并行'属性,化深度计算为分布式广度计算,为实现规模易扩展、计算高并行、系统强鲁棒的通用智能光计算探索了新路径。
据相关资料显示,在“太极”架构中,自顶向下的编码拆分-解码重构机制,将复杂智能任务化繁为简,拆分为多通道高并行的子任务,构建的分布式'大感受野'浅层光网络对子任务分而治之,突破物理模拟器件多层深度级联的固有计算误差。
方璐表示,“之所以将光芯片命名为'太极',也是希望可以在如今大模型通用人工智能蓬勃发展的时代,以光子之道,为高性能计算探索新灵感、新架构、新路径。”
据悉,太极光芯片的计算能效超现有智能芯片2至3个数量级,将可为百亿像素大场景光速智能分析、百亿参数大模型训练推理、毫瓦级低功耗自主智能无人系统提供算力支撑。目前该团队正与相关机构洽谈,建设算力实验室,以期用智能光计算芯片支撑大模型训练与推理、通用人工智能等人工智能研究与应用。
从“太极”第一代芯片发展至如今的第二代,也并不是“一帆风顺”
尽管团队在研发“太极”二代时沿用了电子计算的深度学习架构来构建大规模智能光计算,但在推进了半年后,他们遇到了难以逾越的瓶颈:随着层数的增加,计算规模与计算精度之间出现了不可调和的矛盾。
方璐指出,“以往我们多沿用电子计算架构构建网络结构,但这使得光的优势和潜力无法发挥,仿佛被困在笼中。理论建模和分析表明,正是电子架构限制了光的能力,也就是说,现有的深度神经网络架构并不适合智能光计算。”
为了解决这一瓶颈,研究团队决定打破传统电子架构的思维框架,寻求新的架构突破。他们转向了20世纪80、90年代及更早期的经典研究成果,重新审视和借鉴这些可能被遗忘的智慧,从中找到了突破困境的关键:回归基础,釆用更宽、更浅的设计理念。
方璐认为,回顾经典也意味着回归科研的初心,放下对潮流的盲目追随。这种坚持初心的态度使研究团队能够摆脱时代的束缚,保持对科学问题本质的关注和热情,从而发现新思路,提出新理论。
“太极”二代芯片的诞生是跨学科合作的成果,其中脑科学研究为芯片的架构设计提供了重要的思路。脑科学的“浅脑理论”提出,大脑通过浅层扁平架构形成大规模的并行计算单元,从感知到运动,甚至意识,各脑区在这个浅层网络中发挥着重要作用。方璐补充道,“脑科学的研究成果对我们的工作提供了许多启发。”
然而,推翻构架仅仅只是个开始。接踵而至的是另一个艰巨的挑战:芯片研制“太极”二代芯片的成功是研究团队经过三年不懈努力、经历无数次失败和挑战的结果。在芯片研发的漫长过程中,流片是一个至关重要的里程碑,它标志着理论概念即将转化为实际可制造的芯片。对于方璐及其团队而言,这一阶段充满了期待与焦虑。
方璐解释道,“流片周期通常需要3到6个月,等待芯片加工完成是一段令人焦虑的时期。团队希望芯片能尽快完成,以便进入下一阶段的测试,但同时也担心流片效果不佳,这意味着需要从头开始,时间成本非常高。”
第一次流片时,团队等待了4个月,但结果不如预期。他们不得不从头审视每一个细节,寻找可能存在的问题。经过2个月的调整和优化后,他们又等待了6个月,第二次流片的结果终于让团队成员露出了满意的笑容。
在这项研究中,“太极”二代芯片的实验成果是团队共同努力的结晶。团队成员纷纷表示,“为了让实际实验结果达到理论仿真的预期,我们不断调整和优化实验系统。每一次实验都是漫长而繁琐的,类似的过程重复了百余次。研究团队的目标是将千分类智能任务的准确率提高到90%,最终,我们以超出预期的结果结束了这场'持久战'。”
突破国际封锁的中国科技新发展<br data-mce-fragment="1">中国新研发的“太极”二代芯片代表了中国在高科技领域的重要突破。这一芯片不仅展示了中国在智能光计算技术上的领先地位,还有效绕过了西方对GPU的封锁。
近年来,西方国家,尤其是美国,对中国高科技领域实施了严格的出口管制,特别是在GPU方面。通过对中国科技企业施加制裁和限制,西方国家试图减缓中国在人工智能和高性能计算领域的进步。面对这种局面,中国科技界积极寻找绕过这些限制的解决方案。 “太极”二代芯片的研发正是中国在这种国际压力下釆取的应对策略。通过引入创新的光计算技术,这一芯片成功避开了对GPU的依赖,彰显了中国在面对国际挑战时的自主创新能力和韧性。
“太极”二代芯片的成功不仅体现了中国的科技实力,还有可能对全球科技生态产生深远影响。该芯片的系统级能效远超主流商用AI芯片,预示着智能光计算技术可能引领未来计算模式的变革。未来,这一芯片可能推动更多应用和研究,特别是在人工智能、大数据处理和智能无人系统等领域。此外,其成功还可能激励其他国家和地区在光计算领域投入更多研发资源,进一步推动全球科技创新的步伐。
目前,“太极”二代芯片在图像分类、跨模态内容生成等任务中的卓越表现,展示了其在AI大模型、智能无人系统和通用人工智能/AGI等领域的强大算力支持。这种强大的计算能力不仅可以提升现有技术的效率,还有可能催生新的应用场景和商业模式。在高性能计算需求不断增长的背景下,“太极”二代芯片有望在市场上获得广泛应用,推动相关行业的进一步发展。
“太极”二代芯片的成功不仅依赖于技术创新,也得益于团队的协作和不懈努力。研发过程中,团队经历了多次失败和挑战,通过不断调整和优化,最终克服了技术瓶颈。团队坚持初心的态度展现了科学研究中不断试错和完善的重要性。跨学科合作和经典理论的借鉴,为“太极”二代芯片的研发奠定了坚实基础,也为未来类似研究项目提供了宝贵的经验和启示。
总的来说,“太极”二代芯片的研发不仅是中国科技创新的重要标志,也是一种有效应对国际封锁的策略。这一成果标志着中国在智能计算领域的新突破,并可能对全球科技产业格局产生深远影响。