全球首款 3D 晶圆级封装处理器 IPU 发布,突破 7nm 制程极限

js 原创
2022-03-07 电脑百科网

本周四,总部坐落英国的 AI 芯片公司 Graphcore 发布了新一代 IPU 产品 Bow,这是其第三代 IPU 系统,发布即面向客户发货。与上一代 IPU 比较,Bow IPU 功能前进 40% ,能耗比前进了 16%,电源功率也前进 16%。

值得注意的是,这一次 Bow IPU 的功能前进并非首要依靠选用更先进的制程,Bow IPU 选用了和上一代 IPU 相同的台积电 7nm,经过选用和台积电共同开发的先进硅晶圆堆叠技能(3D Wafer-on-Wafer)到达功能和能耗比的前进。

Bow 作为国际首款 3D WoW 处理器,证明了芯片功能前进的范式从先进制程向先进封装搬运的可行性。

            

新一代 IPU 功能前进 40%,价格坚持不变

2016 年,Graphcore 建立并开创了全新类型处理器架构 IPU,因其在架构上的立异曾被英国半导体之父 Hermann Hauser 称之为是核算机历史上的第三次革命。

阅历 6 年时刻的发展,Graphcore 的 IPU 逐渐在在金融、医疗、电信、机器人、云和互联网等领域取得成效。本周四,Graphcore 又推出了第三代产品 Bow IPU。

据 Graphcore 介绍,第三代 IPU 相对于上一代 M2000,功能前进 40%,每瓦功能前进 16%,即能耗比完成 16% 的前进。不过,AI 芯片的真实功能还需求放在不同的应用领域中评论。为此,Graphcore 也给出了在不同笔直领域中 Bow 的功能表现。

              

在图像方面,无论是典型的 CNN 网络,还是近期比较抢手的 Vision Transformer 网络,以及深层次的文本到图片的网络,与上一代产品比较,Bow IPU 都有 30% 到 40% 的功能前进,在 EfficientNet-B4 这一项中,挨近理论上限值。

BERT 练习模型是自然语言方面的经典模型,根据 BERT,OpenAI 提出了 GPT-1、GPT-2、GPT-3 等纵向扩展或横向扩展,经过更深的网络层次和更宽的网络宽度让模型的功能和精度进一步前进。

“咱们能够看到,这些模型在咱们最新的硬件形态上都有很大的功能前进。”Graphcore 我国工程副总裁、AI 算法科学家金琛介绍道。

             

不仅如此,转换到实践模型中的吞吐量,与 IPU POD64 比较,在核算机视觉的 ResNet50 和 EifficientNet-B4 练习模型中,Bow Pod64 的吞吐量能够到达 34% 和 39% 的功能前进。自然语言方面,BERT-Large Ph1 预练习模型和语音识别 Conformer Large 练习模型,后者都有 36% 的吞吐量前进。

             

作为英伟达的竞争对手,Graphcore 自然不忘将 Bow Pod16 与 DGX-A100 进行比照,试验数据表明,EfficientNet-B4 的 backbone 的练习在 DGX-A100 上需求花费 70 个小时的练习时刻,而在 Bow Pod16 上,只需求 14 小时左右。

挨近理论极限的功能前进,Graphcore Bow IPU 是如何完成的?

5nm 不再是首选,选用先进封装性价比更高

从芯片的规格上看,Bow IPU 是国际上第一款根据台积电的 3D Wafer-On-Wafer 的处理器,单个封装中具有超过 600 亿个晶体管,具有 350 TeraFLOPS 的人工智能核算的功能,是上一代 MK2 IPU 的 1.4 倍。片内存储较上一代来看没有改动,仍然坚持 0.9GB 的容量,不过吞吐量从 47.5TB 前进到了 65TB。

             

“改动首要体现在,它是一个 3D 封装的处理器,晶体管的规划有所增加,算力和吞吐量均得到前进。”Graphcore 大中华区总裁兼全球首席营收官卢涛说道。而在大家都关注的工艺制程上,Bow IPU 连续了上一代台积电 7nm 工艺制程,没有改动。

理论上,一颗芯片的功能前进很大程度上取决于工艺制程上的前进,但随着工艺制程越来越逼近物理极限,摩尔定律逐渐失效,业界不得不寻觅新的技能方历来连续摩尔定律。其间,3D 封装便是被业界广泛看好的技能方向。

我国工程院院士、浙江大学微纳电子学院院长吴汉明就曾在一次讲演中说到,如果将芯片制作和芯片封装相结合,也能够做到 65nm 工艺制程完成 40nm 工艺制程的功能功耗要求。

Bow IPU 正好验证了吴院士的观念。

卢涛表明,Bow IPU 产品功能的前进首要来源于 3D WoW 和新增的 Die。

至于为何选择改动封装方法而不是更先进的工艺,卢涛则表明 MK2 IPU 有 594 亿个晶体管,大约 823 平方毫米,已经是 7nm 单个 Die 能够出产的最精细的芯片。

“咱们评估从 7nm、5nm,到 3nm 等不同工艺节点的收益时发现,从 7nm 到 5nm 的出产工艺前进所带来的收益不像以前从 28nm 到 14nm 相同,能够带来百分之几十的收益,而是降到了 20%。这时候咱们能够经过别的手段和办法取得相同的收益。”

经过 3D 堆叠的方法,Bow IPU 的两个 Die 增加了晶体管的数量,其间一个 Die(Colossus Die)和上一代相同,另一个 Die 首要用于前进跨 Colossus Die 的电源功率传输,优化 Colossus Die 的操作节点,从而转化为有用的时钟加快。

在同台积电的协作方面,卢涛告诉雷峰网,Graphcore 在一年之前就同台积电协作了一颗测验芯片,与台积电的关系非常严密,加上 AI 处理器本身规划较大,需求一些新技能支撑落地,而从台积电的角度而言,新的技能也需求有需求的产品共同推进。

值得一提的是,尽管封装方法有所改动,但 Bow IPU 开箱即用,与前一代产品百分之百软件兼容,不用修正任何代码,老用户无需做任何软件适配工作就能取得功能前进,价格坚持不变。

现在,美国国家试验室 Pacific Northwest 已经根据 Bow IPU 尝试做一些根据 Transformer 的模型以及图神经网络,面向核算化学和网络安全方面的应用,且给出了比较正面的反应。

连续 3D 封装,开发逾越人脑的超级智能机器

Bow IPU 使用 3D 封装仅仅起点,面向未来,Graphcore 正在开发一款能够用来逾越人脑处理的超级智能机器。

Graphcore 将这款正在研制的产品命名为 Good Computer,一方面希望核算机能够为这个国际带来正面的影响,另一方面问候著名核算机科学家 Good。

            

根据 3D WoW,预计未来 Good Computer 将包含 8192 个 IPU,供给超过 10 Exa-Flops 的 AI 算力,完成 4 PB 的存储,能够助力超过 500 万亿参数规划的人工智能模型的开发。

取决于不同的配置,Good Computer 价格将在 100 万美元到 1.5 亿美元之间。

卢涛表明,开发 Good Computer 还是会沿用 IPU 的体系结构,IPU 的存储是在处理器里面,尽管不叫类脑、内存核算或存算一体,但从某种程度上而言,IPU 的运作机理挨近大脑核算的工作原理,仅仅把核算和存储相结合。

另外,Graphcore 也将从软件方面更有用支撑稀疏化以到达类脑的核算量。

新版英伟达 RTX 3060 Ti 性能曝光:采用 GDDR6X 显存,跑分提升 7%至 10% LG 公布新款智慧显示器 32SQ730S,搭载 WebOS 电视系统 Acer 推出 X32 FP mini-LED 电竞显示器:4K / 165Hz Win7和Win10累积更新齐发布 增强了稳定性与安全性 Xulu 推出新款迷你主机 XR1:AMD Ryzen 7 5800U、众筹价 299 美元起 微星旗舰主板 MEG Z690 GODLIKE 超神价格公布:套装 12999 元,限量 300 套
热门文章
为你推荐