杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的？ - 百度鸡巴

百度鸡巴-杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的？

你的位置：百度鸡巴 > 在线影院 > 杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的？

杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的？

发布日期：2024-08-03 16:34 点击次数：161

杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的？

[[423686]]杉原杏璃qvod

今天和全球沿途聊聊--业绩器的多科罚器架构，什么原理呢?

试思一下，假如一台高性能的业绩器有4个CPU，64g的内存，还有一些总线、IO等资源，业绩器里面这些资源是怎么布局的呢?

本文并不会从逻辑电路、芯片想象、cpu历史等等角度去解释，水平有限实战第一，通过本文你将了解到以下内容：

物理中枢 & 逻辑中枢多科罚器架构：SMP、NUMA、MPP 1.物理核和逻辑核

说到CPU早先思到的可能是这么的：

图1 英特尔代号为Cooper Lake的至强铂金9200科罚器

该系列CPU物理封装长宽尺寸为76.0×72.5毫米，亦然当今Intel史上最大的科罚器，那CPU里面是什么样式呢?

CPU里面封装1个大要多个物理核，物理核有寥寂的各级缓存和电路结构，唯有1个物理中枢即是单核CPU，有多个物理中枢即是多核CPU。

图2 4核CPU里面结构简图

对于科罚器规格一致的业绩器来说，总的物理中枢数想象方法为：

物理中枢数=总CPU数*单CPU中物理中枢数

图3 多CPU多物理核简图

超线程是intel于2002年发布的一种时代，全名为Hyper-Threading，简写为HT时代，超线程时代率先仅仅愚弄于至强系列科罚器中，之后接续愚弄在奔腾系列中并将时代主流化，业界对于HT的评价不一，关联词官方并未烧毁超线程时代。

简便来说，HT时代可使科罚器中的1颗物理核，如同2颗物理核那样发达作用，从而提高了系统的全体性能，关联词笃定也不会真是像2颗物理核那样，要否则就抵牾物理端正了，仅仅说借助于某些时代将1颗物理核的性能发达地更好费力。

对于科罚器规格一致的业绩器来说，总的逻辑中枢数想象方法为：

开启HT: 逻辑中枢数=物理中枢数=总CPU数*单CPU中物理中枢数*2杉原杏璃qvod

未开启HT: 逻辑中枢数=物理中枢数=总CPU数*单CPU中物理中枢数

掌捏CPU&物理中枢&逻辑中枢三者的关系之后，可以找一台业绩器望望研究建树，小试牛刀。

图4 CPU&物理核&逻辑核简图

2.多科罚器架构

CPU多了就需要磋商怎么想象，也就出现了几种不同的多科罚器架构。

当今业绩器大体可以分为三类：

对称多科罚器结构 SMP 非一致存储探听结构 NUMA 海量并行科罚结构 MPP

对于咱们来说，SMP和NUMA应该构兵的比拟多，MPP构兵的少一些。

2.1 SMP对称多科罚器结构

SMP是Symmetric Multi-Processor的缩写。

对称多科罚器结构是指多个CPU对称平等，分享相通的物理内存/IO等资源，因此SMP结构属于一致存储器探听结构 UMA。

图5 SMP架构简图

分享模式下总计CPU平等地使用资源，模式简便，在CPU数目未几时效果很可以，关联词优点也可能变为拦路虎。

试思一种场景如若在SMP模式下为了提高业绩器的科罚身手，咱们水平延迟了CPU数目，这些CPU通过相通的总线探听内存。

短篇伦理小说

跟着CPU数目的增多，相通内存地址探听突破将彰着增多，波折酿成了CPU资源阔绰，研究实考据明，SMP业绩器最佳的情况是2-4个CPU。

图6 SMP延迟-效果弧线

2.2 NUMA非一致存储探听结构

前边提到的SMP架构是一致存储器探听结构UMA，相对地就有了Non-Uniform Memory Access架构，是以NUMA结构和SMP架构的显耀辩认在于是否是一致平等探听内存。

NUMA架构的业绩器用有多个 CPU 模块，每个 CPU 模块由多个 CPU构成，每个CPU模块具有寥寂的土产货内存Local-Memory、 I/O等资源，可以将CPU模块称为Node。

图7 NUMA架构CPU模块里面结构

Node之间可以通过互联模块进行数据交互，因此每个 CPU 模块仍然可以探听通盘系统的内存，关联词此时的内存有土产货和外部之分了，探听速率当然也就不一样。

探听CPU模块的土产货内存将远远快于探听其他CPU模块内存，在明确这种架构带来的内存探听相反后，咱们在内容建设愚弄举止时需要尽量减少不同 CPU 模块之间的信拒却互。

图8 NUMA架构全体简图

NUMA 时代相同有裂缝，由于探听远地内存的延时远远逾越土产货内存，当 CPU 数目增多时，系统性能无法线性增多，换句话说增多1倍的CPU数目并不可得回1倍的性能普及，因此仍然存在延迟放浪区。

2.3 MPP海量并行科罚结构

MPP是Massive Parallel Processing的缩写，MPP 是另外一种系统延迟的形式，它由多个 SMP 业绩器通过一定的节点互联收罗进行衔接，完成相通的任务，可以看作是SMP的水平延迟。

在MPP结构中多个 SMP 业绩器是一种宽裕无分享Share Nothing)结构，因而延迟身手最佳，典型的即是刀片业绩器，有的著叙述MPP架构很像MapReduce模式，多个SMP业绩器节点之间通过互联收罗达成，当今并莫得调理的数据通讯契约，何况这部分交互契约对用户是无感知的。

MPP架构有点像刀片业绩器的嗅觉，每一派王人是寥寂的，片与片径直由特定的契约进行数据交互。

图9 MPP架构简图

3 小结

本文的内容并未几，先解释了一些对于CPU&物理核&逻辑核的学问，然后对多科罚器业绩器的常见的三种架构，每种架构王人有不同的特定和使用场景，提倡重心关怀NUMA。

杉原杏璃qvod

水文一篇，先到这里，感谢诸君的倾情阅读。

相关资讯

热点资讯

友情链接：

Powered by 百度鸡巴 @2013-2022 RSS地图 HTML地图

Copyright © 2013-2022 版权所有