百度鸡巴

在线影院    你的位置:百度鸡巴 > 在线影院 >

杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的?

发布日期:2024-08-03 16:34    点击次数:154

杉原杏璃qvod 图解 | 高性能业绩器的CPU是怎么布局的?

[[423686]]杉原杏璃qvod

今天和全球沿途聊聊--业绩器的多科罚器架构,什么原理呢?

试思一下,假如一台高性能的业绩器有4个CPU,64g的内存,还有一些总线、IO等资源,业绩器里面这些资源是怎么布局的呢?

本文并不会从逻辑电路、芯片想象、cpu历史等等角度去解释,水平有限实战第一,通过本文你将了解到以下内容:

物理中枢 & 逻辑中枢 多科罚器架构:SMP、NUMA、MPP 1.物理核和逻辑核

说到CPU早先思到的可能是这么的:

图1 英特尔代号为Cooper Lake的至强铂金9200科罚器

该系列CPU物理封装长宽尺寸为76.0×72.5毫米,亦然当今Intel史上最大的科罚器,那CPU里面是什么样式呢?

CPU里面封装1个大要多个物理核,物理核有寥寂的各级缓存和电路结构,唯有1个物理中枢即是单核CPU,有多个物理中枢即是多核CPU。

图2 4核CPU里面结构简图

对于科罚器规格一致的业绩器来说,总的物理中枢数想象方法为:

物理中枢数=总CPU数*单CPU中物理中枢数

图3 多CPU多物理核简图

超线程是intel于2002年发布的一种时代,全名为Hyper-Threading,简写为HT时代,超线程时代率先仅仅愚弄于至强系列科罚器中,之后接续愚弄在奔腾系列中并将时代主流化,业界对于HT的评价不一,关联词官方并未烧毁超线程时代。

简便来说,HT时代可使科罚器中的1颗物理核,如同2颗物理核那样发达作用,从而提高了系统的全体性能,关联词笃定也不会真是像2颗物理核那样,要否则就抵牾物理端正了,仅仅说借助于某些时代将1颗物理核的性能发达地更好费力。

对于科罚器规格一致的业绩器来说,总的逻辑中枢数想象方法为:

开启HT: 逻辑中枢数=物理中枢数=总CPU数*单CPU中物理中枢数*2杉原杏璃qvod

未开启HT: 逻辑中枢数=物理中枢数=总CPU数*单CPU中物理中枢数

掌捏CPU&物理中枢&逻辑中枢三者的关系之后,可以找一台业绩器望望研究建树,小试牛刀。

图4 CPU&物理核&逻辑核简图

2.多科罚器架构

CPU多了就需要磋商怎么想象,也就出现了几种不同的多科罚器架构。

当今业绩器大体可以分为三类:

对称多科罚器结构 SMP 非一致存储探听结构 NUMA 海量并行科罚结构 MPP

对于咱们来说,SMP和NUMA应该构兵的比拟多,MPP构兵的少一些。

2.1 SMP对称多科罚器结构

SMP是Symmetric Multi-Processor的缩写。

对称多科罚器结构是指多个CPU对称平等,分享相通的物理内存/IO等资源,因此SMP结构属于一致存储器探听结构 UMA。

图5 SMP架构简图

分享模式下总计CPU平等地使用资源,模式简便,在CPU数目未几时效果很可以,关联词优点也可能变为拦路虎。

试思一种场景如若在SMP模式下为了提高业绩器的科罚身手,咱们水平延迟了CPU数目,这些CPU通过相通的总线探听内存。

短篇伦理小说

跟着CPU数目的增多,相通内存地址探听突破将彰着增多,波折酿成了CPU资源阔绰,研究实考据明,SMP业绩器最佳的情况是2-4个CPU。

图6 SMP延迟-效果弧线

2.2 NUMA非一致存储探听结构

前边提到的SMP架构是一致存储器探听结构UMA,相对地就有了Non-Uniform Memory Access架构,是以NUMA结构和SMP架构的显耀辩认在于是否是一致平等探听内存。

NUMA架构的业绩器用有多个 CPU 模块,每个 CPU 模块由多个 CPU构成,每个CPU模块具有寥寂的土产货内存Local-Memory、 I/O等资源,可以将CPU模块称为Node。

图7 NUMA架构CPU模块里面结构

Node之间可以通过互联模块进行数据交互,因此每个 CPU 模块仍然可以探听通盘系统的内存,关联词此时的内存有土产货和外部之分了,探听速率当然也就不一样。

探听CPU模块的土产货内存将远远快于探听其他CPU模块内存,在明确这种架构带来的内存探听相反后,咱们在内容建设愚弄举止时需要尽量减少不同 CPU 模块之间的信拒却互。

图8 NUMA架构全体简图

NUMA 时代相同有裂缝,由于探听远地内存的延时远远逾越土产货内存,当 CPU 数目增多时,系统性能无法线性增多,换句话说增多1倍的CPU数目并不可得回1倍的性能普及,因此仍然存在延迟放浪区。

2.3 MPP海量并行科罚结构

MPP是Massive Parallel Processing的缩写,MPP 是另外一种系统延迟的形式,它由多个 SMP 业绩器通过一定的节点互联收罗进行衔接,完成相通的任务,可以看作是SMP的水平延迟。

在MPP结构中多个 SMP 业绩器是一种宽裕无分享Share Nothing)结构,因而延迟身手最佳,典型的即是刀片业绩器,有的著叙述MPP架构很像MapReduce模式,多个SMP业绩器节点之间通过互联收罗达成,当今并莫得调理的数据通讯契约,何况这部分交互契约对用户是无感知的。

MPP架构有点像刀片业绩器的嗅觉,每一派王人是寥寂的,片与片径直由特定的契约进行数据交互。

图9 MPP架构简图

3 小结

本文的内容并未几,先解释了一些对于CPU&物理核&逻辑核的学问,然后对多科罚器业绩器的常见的三种架构,每种架构王人有不同的特定和使用场景,提倡重心关怀NUMA。

 杉原杏璃qvod

水文一篇,先到这里,感谢诸君的倾情阅读。

 



上一篇:【MXGS-585】寝取られ人妻温泉旅館 ~犯され願望、濡れる美人妻~ 雪菜 北约设置75周年峰会在好意思国举办|军情不雅察

下一篇:杉原杏璃qvod 资治通鉴:如何把别东说念主的失败,酿成我方真金白银的教养?

Powered by 百度鸡巴 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2022 版权所有

top