3 月 26 日消息,据 Neowin 报道,许多安排都运用云来满意他们在存储和人工智能解决方案方面的数据相关需求。为了保证灵敏数据的隐私和安全,必须运用加密核算。这基本上是一套硬件和软件的控制,办理数据怎么被同享和运用,以及数据一切者怎么验证这些进程。
英特尔和 AMD 的 CPU 现已能够创建可信的履行环境(TEEs),在 CPU 层面为加密核算供给支持。TEEs 保证数据在静止状况、传输进程中,甚至在运用进程中都保持加密。它还供给长途验证,以验证硬件的装备,并只对所需的算法授予数据访问权。微软在 Azure 上的加密核算解决方案也运用相同的准则。
但是,现有的解决方案与内置在 CPU 中的 TEE 联络在一起,所以微软现在期望将这一边界也扩展到 GPU,保证数据能够安全地转移到更强壮的硬件上以满意核算需求。当涉及到安排的人工智能作业负载时,这就显得更加重要,微软正在与英伟达在这方面进行协作。
微软现已指出,这不是一个简略的实现,因为它需要维护 GPU 免受各种攻击,同时保证 Azure 主机对办理活动有满足的控制。即使在硬件层面,该实施方案也不能对热能和性能发生负面影响,而且理想情况下,也不需要改动现有的 GPU 微架构。该公司的愿景包含加密 GPU 的以下功用:
-
一种新的模式,GPU 上的一切灵敏状况,包含 GPU 内存,都与主机隔离。
-
在 GPU 芯片上有硬件信任根,能够生成可验证的证明,捕获 GPU 的一切安全灵敏状况,包含一切固件和微代码。
-
对 GPU 驱动程序进行扩展,以验证 GPU 的证明,树立与 GPU 的安全通讯通道,并透明地加密 CPU 和 GPU 之间的一切通讯。
-
硬件支持通过 NVLink 透明地加密一切 GPU-GPU 通讯。
-
在客户操作系统和办理程序中支持将 GPU 安全地连接到 CPU TEE,即使 CPU TEE 的内容是加密的。
微软表示,现已在 Azure 上的 Nvidia A100 Tensor Core GPU 中树立了加密核算能力。这通过安培维护内存(APM)新功用完结。实施细节在本质上是高度技术性的。
这个解决方案现在能够通过 Azure Confidential GPU VMs 进行私密预览。企业现在能够运用最多 4 个 Nvidia A100 Tensor Core GPU 的虚拟机,用于他们的 Azure 作业负载。微软的下一步包含保证更广泛地采用这些做法,并与 Nvidia 协作,在其 Hopper 架构进步一步加强现有的实施。