<div dir="ltr"><div>Clang is really no different than MSVC here (I just double checked).  For SSE you always had to specify the alignment required because it was never guaranteed by the compiler (especially when you get into mandatory 16-byte alignment).  It's interesting that its such a performance issue though, unless your really memory constrained it seems the size/speed trade-off is clearly in favour of 8 byte alignment even though its not technically necessary.<br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jan 15, 2015 at 11:16 AM, mats petersson <span dir="ltr"><<a href="mailto:mats@planetcatfish.com" target="_blank">mats@planetcatfish.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">To be clear: double does not REQUIRE 8 byte alignment, but on<br>
(reasonably modern, like "Pentium onwards", so ca 1994-5 ish) x86<br>
processors would "prefer" 8-byte alignment for "double" values, since<br>
they can then be read as ONE cycle on a 64-bit bus.<br>
<br>
And of course, SSE instructions that aren't specifically designed for<br>
unaligned loads will require a 16-byte alignment. Or does SSE code<br>
automatically modify the alignment criteria for the function?<br>
<br>
Further, shouldn't the stack be aligned to "LargestAlignment" or<br>
whatever it is called? Otherwise, any structure alignment will surely<br>
be "lost"?<br>
<br>
--<br>
Mats<br>
<div class="HOEnZb"><div class="h5"><br>
On 15 January 2015 at 18:38, Smith, Kevin B <<a href="mailto:kevin.b.smith@intel.com">kevin.b.smith@intel.com</a>> wrote:<br>
> Although alignof(double) on windows returns 8, the actual minimum stack alignment is still 4.  Here is a source example illustrating<br>
> this.<br>
><br>
> #include <stdlib.h><br>
><br>
> int a = __alignof(double);<br>
><br>
> extern void crud1(int i, double *p);<br>
><br>
> void crud(void) {<br>
>   double dummy;<br>
>   crud1(0, &dummy);<br>
> }<br>
><br>
> Assembly code produced from VS 2012, compiling with cl -Fa -c -O2 crud.c<br>
> _DATA   SEGMENT<br>
> _a      DD      08H<br>
> _DATA   ENDS<br>
> PUBLIC  _crud<br>
> EXTRN   _crud1:PROC<br>
> ; Function compile flags: /Ogtpy<br>
> ;       COMDAT _crud<br>
> _TEXT   SEGMENT<br>
> _dummy$ = -8<br>
> _crud   PROC<br>
> ; File d:\users\kbsmith1\tc_tmp1\crud.c<br>
> ; Line 7<br>
>         sub     esp, 8<br>
> ; Line 9<br>
>         lea     eax, DWORD PTR _dummy$[esp+8]<br>
>         push    eax<br>
>         push    0<br>
>         call    _crud1<br>
> ; Line 10<br>
>         add     esp, 16<br>
>         ret     0<br>
><br>
> You can see that __alignof(double) produced 8 by the initialization value of a.  You can also see that there is no code at the beginning of function crud to<br>
> align the stack.  So, if it comes in on a 4 byte boundary, it will remain on a 4 byte boundary, and since it subs 8 from esp, if it comes in on an 8 byte boundary<br>
> it will stay on an 8 byte boundary.  Now consider the call to crud1.  This pushes two parameters, and then the call pushes the return address.  So, if the stack<br>
> comes in 8 byte aligned, at the entry to crud1, the stack is now only 4 byte aligned.<br>
><br>
> For this reason, in windows, although __alignof(double) is 8, it doesn't follow that the value of every double * must be such that the pointer value is 8 byte aligned.<br>
><br>
> Also, for IA32 on linux, 4 byte minimum stack alignment used to be specified by the Sys V ABI, which is pretty much the only one you can find references to on the web.  However, for quite a number of years, gcc's default on linux is to assure 16 byte stack alignment at function entry, so that every function that used SSE/SSE2 instructions (and might possibly need to spill) didn't have to perform dynamic stack alignment.  In gcc this is controlled by -mpreferred-stack-boundary=num option.  <a href="https://gcc.gnu.org/onlinedocs/gcc-3.2/gcc/i386-and-x86-64-Options.html" target="_blank">https://gcc.gnu.org/onlinedocs/gcc-3.2/gcc/i386-and-x86-64-Options.html</a>, says the default for this option is 4, implying 16 byte stack alignment.<br>
><br>
> Kevin Smith<br>
><br>
> -----Original Message-----<br>
> From: <a href="mailto:cfe-dev-bounces@cs.uiuc.edu">cfe-dev-bounces@cs.uiuc.edu</a> [mailto:<a href="mailto:cfe-dev-bounces@cs.uiuc.edu">cfe-dev-bounces@cs.uiuc.edu</a>] On Behalf Of palparni<br>
> Sent: Thursday, January 15, 2015 9:34 AM<br>
> To: <a href="mailto:cfe-dev@cs.uiuc.edu">cfe-dev@cs.uiuc.edu</a><br>
> Subject: Re: [cfe-dev] Default stack alignment for x86 changed<br>
><br>
> I understand, so the change was made for Unix-based systems in mind.<br>
> Unfortunately the win32 x86 ABI seems to require doubles to be 64-bit<br>
> aligned. Could we perhaps keep the 8-byte alignment only for win32 targets?<br>
><br>
> Thanks,<br>
> Alpar<br>
><br>
><br>
><br>
> --<br>
> View this message in context: <a href="http://clang-developers.42468.n3.nabble.com/Default-stack-alignment-for-x86-changed-tp4043481p4043483.html" target="_blank">http://clang-developers.42468.n3.nabble.com/Default-stack-alignment-for-x86-changed-tp4043481p4043483.html</a><br>
> Sent from the Clang Developers mailing list archive at Nabble.com.<br>
> _______________________________________________<br>
> cfe-dev mailing list<br>
> <a href="mailto:cfe-dev@cs.uiuc.edu">cfe-dev@cs.uiuc.edu</a><br>
> <a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev</a><br>
><br>
> _______________________________________________<br>
> cfe-dev mailing list<br>
> <a href="mailto:cfe-dev@cs.uiuc.edu">cfe-dev@cs.uiuc.edu</a><br>
> <a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev</a><br>
<br>
_______________________________________________<br>
cfe-dev mailing list<br>
<a href="mailto:cfe-dev@cs.uiuc.edu">cfe-dev@cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/cfe-dev</a><br>
</div></div></blockquote></div><br></div>