Ultima domanda su Nvlink

0
Answer

Come eseguire una copia della memoria point-to-point in modo efficiente per le GPU senza accesso diretto a NVLINK?

Provo a fare la comunicazione punto-punto su workstation DGX con 8 GPU. Posso ottenere buone prestazioni utilizzando cudaMemcpyPeer tra GPU con accesso diretto a NVLINK. Ma alcune GPU non hanno accesso diretto tra loro. Penso di poter utilizzare alcune GPU come punto intermedio per utilizzare NVLINK. Quindi i dati possono essere trasferiti senza utilizzare PCIe. Ma è difficile per me scrivere manualmente un piano di instradamento per ogni dispositivo. Esiste un'API o una soluzione migliore?

nvidia nvlink gpu cuda

1
Answer

Comportamento strano di cudaMemcpyAsync: 1. cudaMemcpyKind non fa differenza. 2. La copia non riesce, ma in silenzio

Mi sto familiarizzando con un nuovo cluster dotato di GPU Pascal P100 + Nvlink. Ho scritto un programma di ping-pong per testare le larghezze di banda di gpu< -> gpu e gpu< -> cpu e l'accesso peer-to-peer. (Sono consapevole che gli esempi di cuda contengono un programma del genere, ma volevo farlo da solo per una migliore comprensione.) Le larghezze di banda di Nvlink sembrano ragionevoli (~ 35 GB/s bidirezionali, con il massimo teorico di 40). Tuttavia, durante il debug del ping-pong ho scoperto un comportamento strano.

cuda cuda uva nvlink

Hot Tags

© 2021   Risposta.org