A40显卡跑pytorch 1.9.0 cuda11.0 nccl2.7.8 DDP模式用nccl backend 执行到reduceOP就卡住是咋回事?
微信里点“发现”,扫一下
二维码便可将本文分享至朋友圈。