Skip to content

Latest commit

 

History

History
32 lines (29 loc) · 1.43 KB

README.md

File metadata and controls

32 lines (29 loc) · 1.43 KB

并行计算

一、概述

二、MPI

三、GPU&CUDA

1.硬件层次

单机多卡内存和GPU、GPU和GPU之间互联可通过PCIE、NVLink、NVSwitch;
多机多卡GPU之间(不同主机)、CPU与GPU之间互联可通过GPUDirect RDMA、IB/万兆以太网 + TCP/IP;

2.软件(库)层次

单机多卡
NCCL;Gloo;
多机多卡
NCCL2.x;MPI;TCP/IP;Gloo;

3.框架层次

  • 模型并行和数据并行
  • PS架构和Ring架构
  • 底层通信方案对比(NCCL,Gloo,MPI……)

-------------------------------------------------

资源