<html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body dir="auto"><div>C<span style="background-color: rgba(255, 255, 255, 0);">ésar,</span></div><div><br></div><div><blockquote type="cite"><div dir="ltr"><div class="gmail_signature"><font color="#000000"><span style="background-color: rgba(255, 255, 255, 0);">- The version of Clang that I am using to compile the benchmarks: 3.5.0</span></font></div></div></blockquote><div><br></div>Clang 3.5 doesn't support OpenMP -- it simply ignores the pragmas.</div><div><br></div><div>Please use version from trunk or from 3_7 release branch. Also, please supply -fopenmp= libomp option.</div><div><br></div><div>Yours,</div><div>Andrey Bokhanko</div><div>=============</div><div>Software Engineer</div><div>Intel Compiler Team</div><div>Intel</div><div><br>Отправлено с iPad</div><div><br>18 авг. 2015 г., в 21:14, César via Openmp-dev <<a href="mailto:openmp-dev@lists.llvm.org">openmp-dev@lists.llvm.org</a>> написал(а):<br><br></div><blockquote type="cite"><div><div dir="ltr">Hello,<div><br></div><div>I don't know if this is the correct list to talk about this - I did not find a better place..<br></div><div><br></div><div>I am doing performance experiments with a few OpenMP implementations (IOMP, GOMP and our private impl.) and I am seeing a severe slowdown when I use IOMP (GOMP and others are performing well). </div><div><br></div><div>The benchmarks I am using are these ones: <a href="http://kastors.gforge.inria.fr/#!index.md">http://kastors.gforge.inria.fr/#!index.md</a><br clear="all"><div></div></div><div><br></div><div>Really, the slowdown is huge. For one of the programs (plasma/dpotrf_taskdep -n 8192 -b 64 -i 1 -c) the serial version executes in ~28s and the parallel one executes in ~110s. I did some profiling and found that most of the time is being spent on synchronization barriers and dependence tracking (see attached image). Before digging deeper I would like to hear back from you if I am doing something wrong here:</div><div><br></div><div>- I tested with the last version of the repository:  <a href="http://llvm.org/svn/llvm-project/openmp/trunk">http://llvm.org/svn/llvm-project/openmp/trunk</a></div><div><div><div class="gmail_signature">- I am using Ubuntu 14.10.</div><div class="gmail_signature">- I have tested on more than one machine, the results above are from a Intel i7-3770</div><div class="gmail_signature">- The runtime itself is compiled using: make compiler=gcc os_omp=linux arch=32e</div><div class="gmail_signature">- The version of GCC that I am using is: 4.9.1</div><div class="gmail_signature">- The version of Clang that I am using to compile the benchmarks: 3.5.0</div><div class="gmail_signature"><br><br>César.</div></div>
</div></div>
</div></blockquote><blockquote type="cite"><div><pic1.png></div></blockquote><blockquote type="cite"><div><pic2.png></div></blockquote><blockquote type="cite"><div><pic3.png></div></blockquote><blockquote type="cite"><div><span>_______________________________________________</span><br><span>Openmp-dev mailing list</span><br><span><a href="mailto:Openmp-dev@lists.llvm.org">Openmp-dev@lists.llvm.org</a></span><br><span><a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/openmp-dev">http://lists.llvm.org/cgi-bin/mailman/listinfo/openmp-dev</a></span><br></div></blockquote></body></html>