<div dir="ltr"><div>Hi all,<br></div><div>I just found when there are multiple offload regions, all the finally assembled kernels use equal amount registers corresponding to the kernel that uses the most registers. This causes all my kernels spilling registers and thus kills performance. This is surprising and I didn't see this behavior with IBM XL compiler.<br></div><div></div><div>The reproducer is provided at <a href="https://bugs.llvm.org/show_bug.cgi?id=46450">https://bugs.llvm.org/show_bug.cgi?id=46450</a></div><div>I also noticed the same issue with AOMP.</div><div>So I'm wondering where could potentially be buggy in the compiling/linking flow.</div><div>Any thoughts?</div><div>Best,<br></div><div>Ye<br></div><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr">===================<br>
Ye Luo, Ph.D.<br>Computational Science Division & Leadership Computing Facility<br>
Argonne National Laboratory</div></div></div></div></div></div>