<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Fri, Apr 11, 2014 at 2:21 AM, John P. Hartmann <span dir="ltr"><<a href="mailto:jphartmann@gmail.com" target="_blank">jphartmann@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">This append is related to integers being expressed as character<br>
constants, e.g., 'a'.  Strings, e.g., "a" are not an issue in the<br>
assembler code produced.<br>
<br>
Consider a trivial program:<br>
<br>
   int main(void) {char a='a';return a;}<br>
<br>
Compiling with<br>
<br>
   clang -target s390x-linux-gnu -S -D__x86_64__ -O2 test.c<br>
<br>
Gets me this assembler:<br>
<br>
main:<br>
        lghi    %r2, 97<br>
        br      %r14<br>
<br>
Which is all correct as z/Linux is an ASCII operating system.<br>
<br>
However, there are other operating systems for IBM's z/Architecture that<br>
use the EBCDIC encoding, and there one wants 0x81 for 'a'.<br>
<br>
If the constant 'a' could pass through the compilation system (even if<br>
the assembler does not support such constants), I would have less than a<br>
smop;</blockquote><div><br></div><div>... what's a smop?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">as it is now, the code generated is indistinguishable from a =<br>

0x61, which should not be converted to EBCDIC.<br>
<br>
Any pointer to where I should start hacking would be greatly appreciated.<br>
<br>
An alternative would be a target specification triple, e.g.,<br>
s390-zvm-cms, but one would still wish to specify the target code page<br>
as Germans are likely to want a different one from the French.  And<br>
presumably that also means a new back end (?)<br>
<br>
Finally, the gcc implementation is not optimal because the conversion is<br>
also applied to strings, in particular the ones in printf() and that<br>
severely messes up the checking as the EBCDIC string is scanned for<br>
ASCII %, which is not helpful.</blockquote><div><br></div><div>Wait, you want for character literals and string literals to use a different encoding? That sounds like a phenomenally bad idea to me. Also, if your printf assumes ASCII, it sounds like your implementation's execution character set really is ASCII...</div>
<div><br></div><div>Supporting execution character sets that are not ASCII is probably not too burdensome, but if we're going to do it, we should do it right (using the same character set for all character and string literals with no encoding-prefix). If you want to go ahead with that, start by looking at lib/Lex/LiteralSupport.cpp.</div>
</div></div></div>