amd为什么叫推土机


CMP与T技术解析及AMD推土机架构设计探讨

CMP技术解析

CMP技术通过直接复制物理核心来扩展处理器在多线程软件中的性能,是一种简单高效的方式以达到最佳性能。但这种方法的缺点在于制造成本高昂,受到处理器制造工艺的限制,无法无限制地增大芯片规模。CMP对负载的要求极高,只有经过适当并行优化的负载才能充分发挥其性能。在某些应用中,主频更高、结构更简单的双核和四核处理器往往能展现出更好的性能。

T技术解析

T技术,如英特尔的Hyper-Threading,允许每个物理核心运行两个同步线程。其核心思想是充分利用每个核心的资源。当线程在等待内存中的关键代码或数据时,通过T技术,物理核心可以切换到另一个线程执行,从而提高核心利用率。

为实现T技术,处理器的代码和存储部分需要复制或分区。例如,双线程T处理器需要独立的架构寄存器和重命名寄存器供每个线程使用。共享指令队列需要足够大以容纳来自两个线程的指令,确保执行单元始终保持忙碌状态。线程的共享单元,如指令缓存,需要被精心设计以避免任何线程独占资源的情况。

推土机架构设计探讨

AMD的“推土机”架构采用了先进的32nmSOI工艺,模块化设计是其一大特色。每个模块包含两个处理器核心,类似于启用了T的单核处理器。每个核心拥有独立的整数调度器和四个专有管线,同时共享浮点调度器和乘法累加器。与之前的K10架构相比,“推土机”在核心设计上有诸多不同,如整数单元管线数量的增加和缓存设计的调整等。

值得一提的是,“推土机”架构中的“模块”设计是为了减少CPU的冗余电路。随着核心数量的增加,如果采用CMP方式,核心面积和功耗都会显著增加。而“模块”设计通过共享浮点部分和独立整数部分的设计,可以大大减少冗余电路,同时确保性能不受影响。这种设计看上去像是T的一种变体或AMD的独特创新。

与传统的T设计相比,“推土机”架构在资源共享方面有所不同。在T中,通常只复制核心的存储部分供每个线程使用,而在“推土机”架构中,每个线程都拥有完整的整数执行单元硬件复制。这种设计创新旨在进一步优化性能和提高效率。

“推土机”架构融合了CMP和T的特点,通过模块化的设计方式实现了高性能与高效率的完美结合。AMD的这种创新设计旨在满足日益增长的多线程处理需求,同时保持合理的制造成本和能耗水平。