如果将部分或全部电子设计自动化(EDA)计算转移到云上,设计公司将能获得灵活的资源和规模经济性,从而缩短产品上市时间并加快创新速度。Mentor,aSiemensBusiness(Mentor)与AdvancedMicroDevices,Inc.(AMD)和MicrosoftAzure(Azure)合作,展示了Calibre平台结合云计算如何能够提供更多计算资源,大幅缩短设计收敛时间,让设计更快上市。采用7nm量产设计,物理验证周期缩短了2.5倍。
CALIBRE云计算
当进入设计流片的紧要关头时,云处理可以为集成电路(IC)设计公司提供比通常多得多的计算资源,使其有机会缩短产品上市时间并加快创新速度。高扩展性工具(例如Calibre平台中的那些工具)可以扩展到数千个内核以减少运行时间……但是,谁会有数千个内核闲置不用呢?当您承受极大的时间压力时,例如进行模块或全芯片验证时,云可提供丰富得多的硬件资源供您使用。
Calibre内核技术多年前就已经为云计算做好了准备[1,2]。云安全性的最新改进减轻了业界对知识产权(IP)保护的担忧,阻碍在云处理模型中实施和使用Calibre技术的最大障碍已被消除。
Mentor与晶圆代工厂、IC公司和云服务提供商密切合作,确保从现场网格系统平稳过渡到场外云处理。发现和明确最佳实践可以让过渡到“云上Calibre”处理模型的公司实现最大获益。IC公司越来越多地希望在先进工艺节点设计中利用云能力来缩短周转时间,在此背景下,他们可以确信,运行云上Calibre将会提供他们知道和信任的相同sign-off验证结果,同时他们还能调整资源使用,以便最好地服务其业务和市场需求。
CALIBRE与云服务器效率
为确保Calibre用户能以最具成本效益的方式使用云资源,我们制定了云使用指导原则,并提出了在云上运行Calibre操作的最佳实践。为了制定和测试这些指导原则与实践,我们与AMD和Azure联合开展了一个项目,采用运行在Azure云服务上的AMDEPYC服务器。结果表明,EPYC服务器和Calibre平台在Azure云上展现出强大的能力。
晶圆代工厂规则集
设计公司应始终使用符合晶圆代工厂要求的最新规则集,以确保实施最新的最佳编码实践。
CALIBRE软件版本
Mentor长期致力于优化Calibre引擎,Calibre每个版本都有改进,使用最新版本的Calibre
软件可确保运行时间和内存消耗更加优化,如图1所示[3]。
图1(左)归一化内存与Calibre发行版,(右)归一化运行时间与Calibre发行版。
云服务器
市场针对云操作提供了许多不同类型的服务器,“最佳”选择取决于客户的需求和应用。对于我们的协作项目,我们选择了可用于MicrosoftAzure公共云的AMDEPYC服务器。不同类型的EPYC服务器有不同的内核、内存、接口和性能特性,云用户可以选择最适合其应用的EPYC服务器。
AMDEPYC架构(图2)的每个插槽有32个内核/64个线程,为大规模并行计算提供了极好的媒介,支持重度计算的运行任务。8个DDR4通道为服务器增加了新的维度,可进一步优化其处理机器密集型计算运行的能力。最后,每4个内核8MBL3内存缓存的层次化设计进一步提升了计算速度。
图2AMDEPYC服务器架构(信息来源AMD。已获得使用许可。)
这些云服务器用于在云服务中创建虚拟机(实例)。针对Calibre应用,我们确定了两种最适合的Azure实例HB60rs和L80sv2。HB60rs和L80sv2均可在EPYC7551处理器上运行,但配置和功能不同。
例如,HB60rs实例与Lv2实例具有相同的EPYC7551处理器,但前者只能访问双插槽机器的64个内核中的60个,并且超线程功能被关闭。Lv2实例旨在支持要求苛刻、存储密集型且需要高水平I/O的工作负荷,而HB系列实例则针对内存带宽驱动的应用(例如流体动力学和显式有限元分析)进行了优化。表1比较了这两类服务器的主要特性。
表1-AMDEPYC服务器特性
CALIBRE云计算
针对该联合项目,我们使用了量产型7nmRadeonInstinctVega20的最终金属流片数据库。该设计是AMD最大的7nm芯片设计,包含超过130亿个晶体管。
初始设置
Calibre2019.2版本与7nm工艺节点的晶圆代工厂规则集的一个生产版本配合使用,以对设计执行设计规则检查(DRC)。对于CalibrenmDRC运行,我们使用了Calibre超远程分布式计算功能[3],其支持多达4,000个内核(图3)。
像所有Calibre分布式计算运行一样,分配了一个主机来管理运行中使用的所有其他资源。为了我们的合作目的,指定的主机和远程服务器均为具有32个CPU内核和256GBRAM内存的AMDEPYC7551服务器。
图3CalibrenmDRC运行时间与内核数的关系。(信息来源AMD。许可使用)
云设置
Mentor使用AMDEPYC服务器(主机和远程服务器均为这种服务器)运行了所有实验,硬件配置如下
■MicrosoftAzureHB60rs实例。对于单个HB60rs,主机与17、25、34、68个远程HB60rs实例一起运行,每个实例均完全专用于运行Calibre作业,使用AzureCycleCloud界面来调用和管理作业。
■地理位置靠近的服务器。使用的所有云服务器均在最靠近用于启动和控制云使用的硬件物理位置的AzureCloud区域中运行。
■为使启动作业和实际执行之间的等待时间最小化,当模块准备就绪时,设计便在云上汇编。
结果
我们的结果展示出以下性能指标
■CalibrenmDRC的运行速度持续提高,直至达到4K内核。
–该扩展曲线中总是存在一个“拐点”,在此点可实现“最佳性价比”。对于该设计和节点,拐点在1.5K和2K内核之间。
■主机和远程服务器使用的峰值累积内存小于500GB。
■实际上,随着内核数量的增加,远程服务器峰值内存有所降低。
在本地CalibrenmDRC运行中,Mentor一般将256个内核用于全芯片DRC,因为这是大多数设计团队在流片期间通常可以访问的现场资源数量。对于大型复杂的7nm设计,例如AMDRadeonVII/MI60GPU,使用256个内核的周转时间可能长达24小时。这意味着一个团队通常每天只能完成一次设计迭代,这比大多数上市时间计划要求的速度要慢很多。
将该数量增加到2K个内核,运行时间可以减少到12小时,每天可以迭代两次,而增加到4K个内核的话,运行时间将不到8小时,每天可以迭代三次。该实验清楚地表明,Calibre扩展的功能和效率与可用内核数量的显著增加相结合,能让使用云上Calibre软件的公司减少运行时间,从而大幅提高设计收敛率。
如前所述,Mentor不断努力提高Calibre的性能,并与晶圆代工厂合作以发现并部署聚焦于性能的规则集优化(同时确保精度相同或更好)。如图3所示,我们运行了一个额外的实验,以了解使用最新版本Calibre和最新的优化规则集是否有任何益处。黄色圆点所示的结果表明,在扩展曲线的拐点处(大约2K个内核)可以再节省三个小时。
云成本最小化
大型片上系统(SOC)设计在验证期间会消耗大量RAM,而RAM是非常昂贵的。即使在云上,较大的RAM实例也很昂贵。解决办法是通过增加远程内核的总数来减少每个远程内核的RAM需求,如图4所示。Calibre平台提供一种经过验证的超远程分布式处理模型[3],用户可以利用此功能降低云资源的成本,同时还能以较少RAM的CPU实现更快的处理速度。
图4峰值内存(RAM)消耗与远程内核使用情况的关系。
结语
Mentor、AMD和Azure之间的合作表明,通过实施EDA云计算的最佳实践和使用指南,可以减少运行时间并降低云使用的成本。公司可以将这些结果作为实施自己的“云上Calibre”的指南。通过实施这些策略和实践,公司可以实现更快的总体运行时间,缩短产品上市时间,加快设计创新,同时维持或降低运营成本。
泊祎回收网遵循行业规范,任何转载的稿件都会明确标注作者和来源;
发布者:泊祎回收网,转载请注明出处:https://www.huishou5.net/dianzi/79732.html