<div dir="ltr">Sorry about that, r229027.<div><br></div><div>Olivier</div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-02-12 18:19 GMT-05:00 Hal Finkel <span dir="ltr"><<a href="mailto:hfinkel@anl.gov" target="_blank">hfinkel@anl.gov</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">----- Original Message -----<br>
> From: "Olivier Sallenave" <<a href="mailto:ohsallen@us.ibm.com">ohsallen@us.ibm.com</a>><br>
> To: <a href="mailto:llvm-commits@cs.uiuc.edu">llvm-commits@cs.uiuc.edu</a><br>
> Sent: Thursday, February 12, 2015 4:57:58 PM<br>
> Subject: [llvm] r228973 - Change max interleave factor to 12 for POWER7 and   POWER8.<br>
><br>
> Author: ohsallen<br>
> Date: Thu Feb 12 16:57:58 2015<br>
> New Revision: 228973<br>
><br>
> URL: <a href="http://llvm.org/viewvc/llvm-project?rev=228973&view=rev" target="_blank">http://llvm.org/viewvc/llvm-project?rev=228973&view=rev</a><br>
> Log:<br>
> Change max interleave factor to 12 for POWER7 and POWER8.<br>
><br>
> Added:<br>
>     llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll<br>
> Modified:<br>
>     llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp<br>
><br>
> Modified: llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp<br>
> URL:<br>
> <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp?rev=228973&r1=228972&r2=228973&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp?rev=228973&r1=228972&r2=228973&view=diff</a><br>
> ==============================================================================<br>
> --- llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp<br>
> (original)<br>
> +++ llvm/trunk/lib/Target/PowerPC/PPCTargetTransformInfo.cpp Thu Feb<br>
> 12 16:57:58 2015<br>
> @@ -226,6 +226,12 @@ unsigned PPCTTIImpl::getMaxInterleaveFac<br>
>    if (Directive == PPC::DIR_E500mc || Directive == PPC::DIR_E5500)<br>
>      return 1;<br>
><br>
> +  // For P7 and P8, floating-point instructions have a 6-cycle<br>
> latency and<br>
> +  // there are two execution units, so unroll by 12x for latency<br>
> hiding.<br>
> +  if (Directive == PPC::DIR_PWR7 ||<br>
> +      Directive == PPC::DIR_PWR8)<br>
> +    return 12;<br>
> +<br>
>    // For most things, modern systems have two execution units (and<br>
>    // out-of-order execution).<br>
>    return 2;<br>
><br>
> Added:<br>
> llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll<br>
> URL:<br>
> <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll?rev=228973&view=auto" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll?rev=228973&view=auto</a><br>
> ==============================================================================<br>
> ---<br>
> llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll<br>
> (added)<br>
> +++<br>
> llvm/trunk/test/Transforms/LoopVectorize/PowerPC/small-loop-rdx.ll<br>
> Thu Feb 12 16:57:58 2015<br>
> @@ -0,0 +1,35 @@<br>
> +; RUN: opt < %s -loop-vectorize -S -debug < %s 2>&1 | FileCheck %s<br>
> +<br>
> +; CHECK: LV: Unroll Factor is 12<br>
<br>
</div></div>You'll need to add:<br>
; REQUIRES: asserts<br>
<br>
to this test because it checks debug output (you'll break the -Asserts builds otherwise). However, I'd rather you not do that, just run the optimization and add a sufficient number of CHECK lines to make sure that we have the desired number of interleave iterations.<br>
<br>
Something like this should do it:<br>
<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK: fadd<br>
CHECK-NOT: fadd<br>
<br>
 -Hal<br>
<div class="HOEnZb"><div class="h5"><br>
> +<br>
> +target datalayout = "e-m:e-i64:64-n32:64"<br>
> +target triple = "powerpc64le-ibm-linux-gnu"<br>
> +<br>
> +define void @test(double* nocapture readonly %arr, i32 signext %len)<br>
> #0 {<br>
> +entry:<br>
> +  %cmp4 = icmp sgt i32 %len, 0<br>
> +  br i1 %cmp4, label %<a href="http://for.body.lr.ph" target="_blank">for.body.lr.ph</a>, label %for.end<br>
> +<br>
> +<a href="http://for.body.lr.ph" target="_blank">for.body.lr.ph</a>:                                   ; preds = %entry<br>
> +  %0 = add i32 %len, -1<br>
> +  br label %for.body<br>
> +<br>
> +for.body:                                         ; preds =<br>
> %for.body, %<a href="http://for.body.lr.ph" target="_blank">for.body.lr.ph</a><br>
> +  %indvars.iv = phi i64 [ 0, %<a href="http://for.body.lr.ph" target="_blank">for.body.lr.ph</a> ], [ %indvars.iv.next,<br>
> %for.body ]<br>
> +  %redx.05 = phi double [ 0.000000e+00, %<a href="http://for.body.lr.ph" target="_blank">for.body.lr.ph</a> ], [ %add,<br>
> %for.body ]<br>
> +  %arrayidx = getelementptr inbounds double* %arr, i64 %indvars.iv<br>
> +  %1 = load double* %arrayidx, align 8<br>
> +  %add = fadd fast double %1, %redx.05<br>
> +  %indvars.iv.next = add i64 %indvars.iv, 1<br>
> +  %lftr.wideiv = trunc i64 %indvars.iv to i32<br>
> +  %exitcond = icmp eq i32 %lftr.wideiv, %0<br>
> +  br i1 %exitcond, label %for.end.loopexit, label %for.body<br>
> +<br>
> +for.end.loopexit:                                 ; preds =<br>
> %for.body<br>
> +  %add.lcssa = phi double [ %add, %for.body ]<br>
> +  br label %for.end<br>
> +<br>
> +for.end:                                          ; preds =<br>
> %for.end.loopexit, %entry<br>
> +  %redx.0.lcssa = phi double [ 0.000000e+00, %entry ], [ %add.lcssa,<br>
> %for.end.loopexit ]<br>
> +  ret void<br>
> +}<br>
><br>
><br>
> _______________________________________________<br>
> llvm-commits mailing list<br>
> <a href="mailto:llvm-commits@cs.uiuc.edu">llvm-commits@cs.uiuc.edu</a><br>
> <a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits</a><br>
><br>
<br>
</div></div><span class="HOEnZb"><font color="#888888">--<br>
Hal Finkel<br>
Assistant Computational Scientist<br>
Leadership Computing Facility<br>
Argonne National Laboratory<br>
</font></span><div class="HOEnZb"><div class="h5">_______________________________________________<br>
llvm-commits mailing list<br>
<a href="mailto:llvm-commits@cs.uiuc.edu">llvm-commits@cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits</a><br>
</div></div></blockquote></div><br></div>