U vraagt, wij geven antwoord!

Tensorflow Tesla® instances benchmark

Samenvatting van testmodelresultaten voor beeldclassificatie met Tesla® LeaderGPU®-servers

LeaderGPU® is een nieuwe speler op de markt voor GPU-computing en is van plan de spelregels te veranderen. Op dit moment bestaat de GPU-computermarkt uit verschillende grote spelers zoals Amazon AWS, Google Cloud, enz. Een grote speler betekent echter niet altijd het beste aanbod op de markt. Het LeaderGPU®-project biedt, in vergelijking met Amazon AWS en Google Cloud, fysieke servers, geen VPS, waar hardwareresources kunnen worden gedeeld door enkele tientallen gebruikers.

Er werden tests uitgevoerd op de LeaderGPU® Tesla® computersystemen op synthetische gegevens van de volgende netwerkmodellen: ResNet-50, ResNet-152, VGG16 en AlexNet. Aan het einde van dit artikel vindt u de resultaten van tests die zijn uitgevoerd op andere modellen. Het testen van synthetische gegevens werd uitgevoerd met tf.Variable naar analogie met de modellen geconfigureerd voor ImageNet.

De volgende commando's werden gebruikt om de test uit te voeren:

git kloon https://github.com/tensorflow/benchmarks.git
python3.5 benchmarks/scripts/tf_cnn_benchmarks/tf_cnn_benchmarks.py --num_gpus=2 --model alexnet (vgg11, vgg16, etc.) --batch_size 32 (64, 128, 256, 512)

LeaderGPU® Tesla® instanties

Testomgeving: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink™ (ltbv46)

Instantietype: 2 x Tesla® P100 PCI (ltbv32), 2 x Tesla® V100 PCI (ltbv20), 2 x Tesla® V100 NVLink (ltbv46)
GPU's: Nvidia® Tesla® kaarten OS: CentOS 7 CUDA® / cuDNN: 9.0 / 7.0.5 TensorFlow™ 1.7 van repo Benchmark GitHub hash: 9165a70 Datum van testen: 25.04.2018

Opties

Inception V3

VGG16

ResNet-50

ResNet-152

Alexnet

Batchgrootte op GPU

64

32

64

32

512

Optimalisatie

sgd

sgd

sgd

sgd

sgd

picture

Test synthetische gegevens (beelden / s)

GPU's InceptionV3 VGG16 ResNet-50 ResNet-152 Alexnet

2x P100

268.24 224.90 446.08 150.04 5252.43

2x PCI V100

430.77 309.82 667.62 213.04 7545.40

2x NVlink™ V100

450.75 417.22 698.97 236.90 8786.56

Andere resultaten

Testen synthetische gegevens (beelden / s)

2x PCI Tesla® P100

Batchgrootte Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1411.48 378.47 224.90 199.87 14944.76 788.43
64 2460.54 473.82 256.68 225.58 29215.60 913.38
128 3576.26 539.08 278.83 243.67 47375.83 1035.37
256 4545.45 561.73 - - 67116.75 1127.05
512 5252.43 - - - 83665.27 1165.75
Partijgrootte overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 548.55 248.72 122.22 389.73 220.26 150.04
64 952.51 268.24 133.96 446.08 253.86 176.09
128 1437.54 283.39 - 483.51 - -
256 1847.21 - - - - -
512 2186.47 - - - - -

2x PCI Tesla® V100

Partijgrootte Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 1665.82 526.55 309.82 282.81 17583.47 1268.95
64 3056.89 695.42 374.22 331.41 32271.30 1487.77
128 4660.06 831.39 410.27 360.79 62652.62 1704.92
256 6255.16 729.42 - - 98828.17 1921.02
512 7545.40 - - - 136553.56 2039.60
Partijgrootte overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 625.35 371.94 186.38 579.01 318.30 213.04
64 1194.50 430.77 210.41 667.62 379.37 259.16
128 1934.71 462.09 - 746.73 - -
256 2690.65 - - - - -
512 3267.15 - - - - -

2x NVlink™ Tesla® V100

Partijgrootte Alexnet vgg11 vgg16 vgg19 lenet googlenet
32 3743.79 775.95 417.22 360.08 12460.77 1250.49
64 5514.97 904.65 447.46 386.92 28038.87 1546.01
128 6990.88 982.62 465.05 401.43 50064.03 1791.36
256 7960.86 805.59 - - 94842.75 1895.35
512 8786.56 - - - 131914.42 2158.45
Partijgrootte overfeat inceptionv3 inception4 resnet50 resnet101 resnet152
32 1404.21 397.70 195.51 602.97 341.20 236.90
64 2216.08 450.75 220.00 698.97 395.01 272.37
128 3005.20 475.38 - 781.50 - -
256 3656.48 - - - - -
512 4073.38 - - - - -



Bijgewerkt: 18.03.2025

Gepubliceerd: 26.04.2018


Hebt u nog vragen? Schrijf ons!

By clicking «I Accept» you confirm that you have read and accepted the website Terms and Conditions, Privacy Policy, and Moneyback Policy.