Martin Kröning
Pi Parallelization Examples

Repository

$ CXX=clang++ CXXFLAGS="-march=native" meson setup --buildtype=release buildclangrelease
$ ninja -C buildclangrelease test
$ ./buildclangrelease/pi-calculator-portable/pi-calculator-portable-benchmark
$ ./buildclangrelease/pi-calculator-avx/pi-calculator-avx-benchmark
Benchmark                                  Time           CPU Iterations
-------------------------------------------------------------------------
BM_PiCalculatorVanilla               1470575 ns    1468924 ns        473
BM_PiCalculatorOpenMPSIMD             838745 ns     838071 ns        822
BM_PiCalculatorOpenMPParallel         769489 ns     764301 ns        769
BM_PiCalculatorOpenMPParallelSIMD     413227 ns     411954 ns       1696
Benchmark                         Time           CPU Iterations
----------------------------------------------------------------
BM_PiCalculatorAVXASM        573359 ns     573062 ns       1214
BM_PiCalculatorAVXIntrin     573359 ns     573079 ns       1209
Benchmark                                  Time           CPU Iterations
-------------------------------------------------------------------------
BM_PiCalculatorVanilla               1582090 ns    1580321 ns        438
BM_PiCalculatorOpenMPSIMD             670314 ns     669561 ns       1030
BM_PiCalculatorOpenMPParallel         824931 ns     822780 ns        835
BM_PiCalculatorOpenMPParallelSIMD     296564 ns     295824 ns       2365
Benchmark                                  Time           CPU Iterations
-------------------------------------------------------------------------
BM_PiCalculatorVanilla               1584891 ns    1584221 ns        442
BM_PiCalculatorOpenMPSIMD             573493 ns     573227 ns       1204
BM_PiCalculatorOpenMPParallel         826333 ns     825273 ns        794
BM_PiCalculatorOpenMPParallelSIMD     296294 ns     288988 ns       2424
Benchmark                                  Time           CPU Iterations
-------------------------------------------------------------------------
BM_PiCalculatorVanilla                573767 ns     573524 ns       1212
BM_PiCalculatorOpenMPSIMD             573311 ns     573069 ns       1183
BM_PiCalculatorOpenMPParallel         288170 ns     287855 ns       2425
BM_PiCalculatorOpenMPParallelSIMD     290118 ns     288521 ns       2428