Contexte
Sur le nouveau lieu de travail, j'ai été placé derrière un PC équipé d'un processeur Ryzen 2600 et d'une carte vidéo Radeon RX 580. Après avoir essayé d'entraîner les réseaux de neurones sur le processeur, j'ai réalisé que ce n'était pas le cas: le processus était trop lent. Après quelques recherches, j'ai découvert qu'il existe au moins 2 façons d'exécuter des bibliothèques de machine learning modernes sur des cartes graphiques Radeon: PlaidML et ROCm. J'ai essayé les deux et je veux partager les résultats.
PlaidML: multiplateforme à la pointe
TensorFlow Keras, , GPU. , Nvidia CUDA.
PlaidML - Keras OpenCL. Keras , AMD. Windows, Linux Mac.
UPD: MikeLP , :
Keras . , PlaidML CUDA. , , Keras Tensorflow. — « ». PlaidML Keras, a tf.Keras — API . C PlaidML, Keras API Tensorflow. PlaidML ( Intel) roadmap .
, PlaidML , .. Keras Tensorflow API . Keras+PlaidML .
PlaidML . Python- :
pip install plaidml-keras && plaidml-setup
PlaidML :
os.environ["KERAS_BACKEND"] = "plaidml.keras.backend"
. :
plaidbench keras mobilenet
. RX 580 Ryzen 2600 , :
|
|
|
|
Radeon RX 580 |
6.14s |
6.51s |
Radeon Vega Frontier Edition |
4.56s |
5.50s |
GeForce GTX 1080 TI |
2.52s |
4.83s |
Intel HD Graphics 5500 |
36.64s |
755.23s |
AMD Ryzen 2600 (CPU) |
5.04s |
254.70s |
AMD Nvidia. , . Intel HD Graphics: PlaidML Intel .
ROCm:
Radeon Open Compute Platform (ROCm), AMD GPU . ROCm NVIDIA CUDA. UNIX-.
ROCm . , ~2 , PlaidML, , PlaidML Out Of Memory.
Ubuntu 20.04 LTS. ROCm : ( , .. )
:
sudo apt update && sudo apt dist-upgrade && sudo apt install libnuma-dev && sudo reboot
5.8 5.6. http://kernel.ubuntu.com/~kernel-ppa/mainline/ :
linux-headers-VERSION-NUMBER_all.deb linux-headers-VERSION-NUMBER_amd64.deb linux-image-VERSION-NUMBER_amd64.deb linux-modules-VERSION-NUMBER_amd64.deb
, :
sudo dpkg -i *.deb
5.6, GRUB. 5.8:
sudo apt-get purge *5.8.0*
.
:
wget -q -O - https://repo.radeon.com/rocm/rocm.gpg.key | sudo apt-key add - echo 'deb [arch=amd64] https://repo.radeon.com/rocm/apt/debian/ xenial main' | sudo tee /etc/apt/sources.list.d/rocm.list
ROCm:
sudo apt update && sudo apt install rocm-dkms && sudo reboot
:
sudo usermod -a -G video $LOGNAME sudo usermod -a -G render $LOGNAME
. , GPU:
/opt/rocm/bin/rocminfo /opt/rocm/opencl/bin/clinfo
ROCm PATH:
echo 'export PATH=$PATH:/opt/rocm/bin:/opt/rocm/rocprofiler/bin:/opt/rocm/opencl/bin' | sudo tee -a /etc/profile.d/rocm.sh
:
sudo apt install rocm-libs miopen-hip rccl
Pip TensorFlow:
sudo apt install python3-pip pip3 install --user tensorflow-rocm
! TensorFlow GPU:
:
python3 ./tf_cnn_benchmarks.py --num_gpus=1 --batch_size=64 --model=resnet50
RX 580 , :
|
|
/ (ResNet 50) |
AMD Radeon VII |
284 |
AMD Radeon RX Vega 56 |
131 |
AMD Radeon RX 580 |
92 |
Nvidia GeForce 2080 Ti |
293 |
Nvidia GeForce GTX 1070 |
126 |
Nvidia GeForce RTX 3080 10GB |
396 |
2021 , . AMD Nvidia, . , Radeon , .
Si vous possédez déjà une carte graphique d'AMD, vous n'aurez peut-être pas besoin de la remplacer par une carte graphique Nvidia à des fins de développement. Je considère que le framework ROCm est le choix optimal pour l'apprentissage automatique sur les cartes vidéo Radeon. Il offre des performances décentes et permet à TensorFlow 2.2.0 et Keras de fonctionner.