<div dir="ltr">Hi Owen,<div><br></div><div>Thanks for the clarification. I'm happy using maxnum/minnum (for floats) in that case!</div><div><br></div><div>James</div></div><br><div class="gmail_quote">On Thu, 23 Apr 2015 at 19:50 Owen Anderson <<a href="mailto:resistor@mac.com">resistor@mac.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">It’s not really about strictness/orderedness, just that different standards mandate different things.  They match the IEEE definition, as well as C99 and most GPU languages.  Other languages (notably, Java) disagree.</div><div style="word-wrap:break-word"><div><br></div><div>—Owen</div></div><div style="word-wrap:break-word"><div><br><div><blockquote type="cite"><div>On Apr 23, 2015, at 11:46 AM, James Molloy <<a href="mailto:james@jamesmolloy.co.uk" target="_blank">james@jamesmolloy.co.uk</a>> wrote:</div><br><div><div dir="ltr">Hi Owen,<br><br>So my impression was that minnum and maxnum aren't exactly min/max, depending on strictness and ordered-ness. For example, AArch64 has both FMIN and MINNUM instructions that behave subtly differently on NaN and -0.0.<div><br></div><div>My intention was to select minnum where possible, but it's useful to have a strict corollary.</div><div><br></div><div>James</div></div><br><div class="gmail_quote">On Thu, 23 Apr 2015 at 19:28 Owen Anderson <<a href="mailto:resistor@mac.com" target="_blank">resistor@mac.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">We already have @llvm.minnum and @llvm.maxnum for floating point types.<br>
<br>
—Owen<br>
<br>
> On Apr 23, 2015, at 7:42 AM, James Molloy <<a href="mailto:james@jamesmolloy.co.uk" target="_blank">james@jamesmolloy.co.uk</a>> wrote:<br>
><br>
> Hi all,<br>
><br>
> I've just started again on trying to solve the problem of getting decent code generation for min, max and abs idioms as used by the programmer and as emitted by the loop vectorizer.<br>
><br>
> I've been looking at doing this as a target DAGCombine, but actually I think:<br>
>   1. it's incredibly complex to do at that stage and it limits all the work I do to just one target.<br>
>   2. It's also much more difficult to test.<br>
>   3. The loop and SLP vectorizers still don't have a cost model for them - they're just seen as compare+selects.<br>
><br>
> So my proposal is:<br>
>   * To add new intrinsics for minimum, maximum and absolute value. These would have signed int/unsigned int/float variants and be valid across all numeric types.<br>
>   * To add a pass fairly early in the pipeline to idiom recognize and create intrinsics. This would be controllable per-backend - if a backend doesn't have efficient lowering for these operations, perhaps it's best not to do the idiom recognition.<br>
><br>
> The cost model would then fall out in the wash, because we already have a cost model for intrinsics, it would be as simple as adding new instructions. Because we idiom recognize at the IR stage instead of the SDAG stage, we also wouldn't have to rely on the min/max idioms being in canonical "select" form; we could match a branch sequence also.<br>
><br>
> What do you think? Is this an acceptable proposal?<br>
><br>
> Cheers,<br>
><br>
> James<br>
> _______________________________________________<br>
> llvm-commits mailing list<br>
> <a href="mailto:llvm-commits@cs.uiuc.edu" target="_blank">llvm-commits@cs.uiuc.edu</a><br>
> <a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits</a><br>
<br>
</blockquote></div>
</div></blockquote></div><br></div></div></blockquote></div>