博客

技术分享

Ansys HPC Pack——解读 CPU 和 GPU 的 Ansys 许可

2024.08.02 83分钟阅读

Ansys 的许可格式相当复杂，启用更多计算节点或更高性能的硬件将需要更多的许可。Ansys 考虑了称为 HPC Pack 的特定工作负载启用的内核数量。每个许可证的价格会波动，所以我们不会在这里提到具体价格。

01 什么是 Ansys HPC Pack？

HPC Pack 是定义为 Ansys 计算启用的受支持内核总数的许可证。购买的 HPC Pack 的数量决定了您在一次计算中可以使用的指定 CPU 核数。

许可模式通常涉及为单个系统购买一定数量的 HPC Pack，然后允许使用确定数量的计算。购买的 HPC Pack 越多，支持更快性能的内核就越多。确定所需包的数量取决于所执行模拟的大小和复杂性，以及所需的分析速度和效率等因素。

HPC Pack 启用的内核数量是通过以下简单公式计算的，其中 h=HPC Pack 的数量。这些内核通常指物理 CPU 内核或 GPU 流式多处理器（SM）。稍后将详细介绍 SM。无论购买何种 HPC Pack，都默认提供4个求解器核心。特定 HPC Pack 中提供的总核心的公式如下，其中 h 是 HPC Pack 层：

因此，表格如下。我们只会增加到5个，但如有必要，您可以使用上述公式访问下一层进行更多分配。

HPC PACK	HPC Pack 核心	求解器核心	总核心数
0	0	4	4
1	8	4	12
2	32	4	36
3	128	4	132
4	512	4	516
5	2048	4	2052

CPU 核心计数和 Ansys HPC Pack 矩阵

Ansys HPC Pack 是一个指数函数增益，因此从20个核心增加到2000个核心不会产生100倍的价格成本。这些核心总数意味着，即使您的系统容纳的核心数量超过给定的 HPC Pack 数量，这些核心也将在计算中处于非活动状态。例如，一个拥有2个 HPC Pack 的人只能使用36个内核，所以如果你的系统总共有48个内核，它只会使用36个，其余的都是空闲的。

组织可以选择拆分或合并其 HPC Pack 许可证。但是，每个系统的核心计算不同。例如，如果一个组织希望在2个独立的系统之间分发4个 HPC Pack （2个 Pack +2个 Pack ），那么该组织将拥有36+36=72个核心。如果他们不分发这些 “Pack” 并将其整合到一个系统中，那么4个 HPC Pack 将产生516个内核。

个性化工作站可以使有多个部门运行模拟并且不需要/不想管理计算资源的组织受益。一个整合的系统可以使那些不时运行需要大量计算的大型模拟的组织受益。用户仍然可以在多个处理器或计算节点上分发他们的模拟，但需要定义求解器核心。这两种方法都加速了模拟过程，使他们能够解决工程问题。这可以提高生产率，加快产品上市时间，更好地优化设计。

02 关于 GPU 的 Ansys HPC Packs

Ansys HPC Pack 不仅定义了 CPU 的许可成本；它们还定义了在 GPU 上运行 Ansys 时的成本。许多 Ansys 仿真应用程序仍然依赖于 CPU，但 GPU 在现代高性能计算中至关重要，一些 Ansys 仿真求解器在 GPU 上加速或原生，包括 Fluent、Rocky 等某些仿真求解器。

GPU 微架构与 CPU 不同，CPU 的内核数量是 CPU 的数百倍。因此，他们使用 SM 或流式多处理器，而不是使用核心计数作为变量。这里不详细介绍 GPU 微架构，但流式多处理器或 SM 是存储多个内核、缓存和控制器的 GPU 的构建块。将 SM 视为一组负责计算、内存管理、指令管道等任务的工人，GPU 有一个由这些工人组成的工厂。这些 SM 支持并行计算，因此，在这种情况下，Ansys 将其视为“核心”。

SMs	HPC 工作组	HPC Packs
1-40	0	0
41-48	1-8	1
49-72	9-32	2
73-168	33-128	3
169-552	129-512	4
553-2088	513-2048	5

找到 GPU 的 SM 并不像查看规格表那么容易。我们列出了当前一代和流行的 GPU 型号及其 SM 计数，这些型号是通过浏览 GPU 微架构白皮书和 techpowerup.com 等第三方来源发现的。我们还将比较每个 GPU 对应的 HPC Pack 数量。我们还添加了 GPU 内存，以帮助衡量哪些 GPU 适合您的潜在模型大小（这不会影响 HPC 包许可）。

GPU	SM 数	HPC Packs	GPU 内存
RTX 2000 Ada	22	0	16GB GDDR6
RTX 4000 Ada	48	1	20GB GDDR6
RTX 4500 Ada	60	2	24GB GDDR6
RTX 5000 Ada	100	3	32GB GDDR6
RTX 6000 Ada	142	3	48GB GDDR6

与 GPU 配置超过 HPC Pack 的 SM 计数阈值时 HPC Pack 对 CPU 的工作方式不同，由于 SM 不能通过意志禁用，因此需要额外购买下一层。因此，根据配置的不同，有必要仔细考虑单个或多个 GPU，以优化每个 HPC Pack 许可证。一些 GPU 应该优先于此列表中的其他 GPU，因为它们最大限度地增加了每个 HPC Pack 的可用 SM 数量。

例如，单个 RTX 5000 Ada（100 SM）需要3个 HPC Pack（最多 168 SM）。更快、更大的 RTX 6000 Ada（142 SM）也将花费3个 HPC Pack。通过支付更高级别卡的价格，您可以在获得更好性能的同时，最大限度地提高您为 Ansys HPC Pack 许可支付的价格。但对于多 GPU 配置，情况略有不同：

GPU	SM Count	HPC Packs	GPU Memory
1xRTX 6000 Ada	142	3	48GB GDDR6
2xRTX 6000 Ada	284	4	96GB GDDR6
3xRTX 6000 Ada	426	4	144GB GDDR6
4xRTX 6000 Ada	568	5	192GB GDDR6
1xRTX 5000 Ada	100	3	32GB GDDR6
2xRTX 5000 Ada	200	4	64GB GDDR6
3xRTX 5000 Ada	300	4	96GB GDDR6
4xRTX 5000 Ada	400	4	128GB GDDR6

在 4xGPU 配置中，RTX 6000 Ada 可能不是一项明智的投资，因为您需要购买额外的许可证才能运行它。通过最大限度地提高每个内核或每个 SM 的限制，而不会溢出到下一个支架，从而在许可方面采取策略。RTX 5000 Ada 可能有点慢，但如果模拟大小需要4个 GPU，那么购买额外的 GPU 而不需要额外的许可证可能会影响预算和性能考虑。

03结论

在 Ansys 中加速计算对于工程师在将产品设计放在装配线上并最终交到消费者手中之前完善产品设计至关重要。通过更快地运行模拟，可以更快地进行改进，创新产品可以更快地推向市场。

配置高性能 Ansys 系统有很多因素，包括硬件、许可成本、性能和基础设施。优化性价比对于在这样的大型投资中实现价值最大化至关重要。半岛.综合体育入口在这里提供集群调度软件和工具，以减少模拟时间和助力更快的成功。如果您对硬件配置有任何疑问，请联系我们的团队，我们将尽最大努力帮助您解答疑问和需求。

注册我们的通讯。

免费资源

浏览我们的白皮书、电子书、案例研究和参考架构

搜索

主题

有什么问题吗？

联系我们

半岛·综合体育(中国)官方网站-登录入口

博客

Ansys HPC Pack——解读 CPU 和 GPU 的 Ansys 许可

相关贴子

我们什么时候该对 LLM 进行微调和使用 RAG ？

SXM 与 PCIe：最适合训练 LLM 的 GPU，如 GPT-4

为何最新的大型语言模型（LLM）倾向于采用 MoE（Mixture of Experts, MoE）架构作为其设计核心？

技术焦点：集群管理软件

使用 cuCIM 和 NVIDIA GPU DIRECT STORAGE加速数字病理学工作流程

注册我们的通讯。

免费资源

主题

有什么问题吗？

相关贴子

深度解析 | 新型智算中心技术构建中 AI 大模型应用的建设

【技术大讲堂】Perturbo-2.0 的安装

AlphaFold 更新显著提高了对接、核酸和 PTMS 的准确性

注册我们的通讯。

敬请登记。