<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Wed, Jul 17, 2013 at 6:06 PM, Peter Collingbourne <span dir="ltr"><<a href="mailto:peter@pcc.me.uk" target="_blank">peter@pcc.me.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<br>
I would like to propose that we introduce a mechanism in IR to allow<br>
arbitrary data to be stashed before a function body.  The purpose of<br>
this would be to allow additional data about a function to be looked<br>
up via a function pointer.  Two use cases come to mind:<br>
<br>
1) We'd like to be able to use UBSan to check that the type of the<br>
   function pointer of an indirect function call matches the type of<br>
   the function being called.  This can't really be done efficiently<br>
   without storing type information near the function.<br></blockquote><div><br></div><div>How efficient does it have to be? Have some alternatives already proven to be "too slow"? (e.g. a binary search into a sorted table)</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
2) Allowing GHC's tables-next-to-code ABI [1] to be implemented.<br>
   In general, I imagine this feature could be useful for the<br>
   implementation of languages which require runtime metadata for<br>
   each function.<br>
<br>
The proposal is that an IR function definition acquires a constant<br>
operand which contains the data to be emitted immediately before<br>
the function body (known as the prefix data).  To access the data<br>
for a given function, a program may bitcast the function pointer to<br>
a pointer to the constant's type.  This implies that the IR symbol<br>
points to the start of the prefix data.<br>
<br>
To maintain the semantics of ordinary function calls, the prefix data<br>
must have a particular format.  Specifically, it must begin with a<br>
sequence of bytes which decode to a sequence of machine instructions,<br>
valid for the module's target, which transfer control to the point<br>
immediately succeeding the prefix data, without performing any other<br>
visible action.  This allows the inliner and other passes to reason<br>
about the semantics of the function definition without needing to<br>
reason about the prefix data.  Obviously this makes the format of the<br>
prefix data highly target dependent.<br></blockquote><div><br></div><div>I'm not sure that something this target dependent is the right choice. Your example below suggests that the frontend would then need to know magic to put "raw" in the instruction stream. Have you considered having the feature expose just the intent "store this data attached to the function, to be accessed very quickly", and then have an intrinsic ("llvm.getfuncdata.i{8,16,32,64}"?) which extracts the data in a target-dependent way? Forcing clients to embed deep target-specific-machine-code knowledge in their frontends seems like a step in the wrong direction for LLVM.</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
This requirement could be relaxed when combined with my earlier symbol<br>
offset proposal [2] as applied to functions.  However, this is outside<br>
the scope of the current proposal.<br>
<br>
Example:<br>
<br>
%0 = type <{ i32, i8* }><br>
<br>
define void @f() prefix %0 <{ i32 1413876459, i8* bitcast ({ i8*, i8* }* @_ZTIFvvE to i8*) }> {<br>
  ret void<br>
}<br>
<br>
This is an example of something that UBSan might generate on an<br>
x86_64 machine.  It consists of a signature of 4 bytes followed by a<br>
pointer to the RTTI data for the type 'void ()'.  The signature when<br>
laid out as a little endian 32-bit integer decodes to the instruction<br>
'jmp .+0x0c' (which jumps to the instruction immediately succeeding<br>
the 12-byte prefix) followed by the bytes 'F' and 'T' which identify<br>
the prefix as a UBSan function type prefix.<br></blockquote><div><br></div><div>Do you know whether OoO CPU's will still attempt to decode the "garbage" in the instruction stream, even if there is a jump over it? (IIRC they will decode ahead of the PC and hiccup (but not fault) on garbage). Maybe it would be better to steganographically encode the value inside the instruction stream? On x86 you could use 48b8<imm64> which only has 2 bytes overhead for an i64 (putting a move like that, which moves into a caller-saved register on entry, would effectively be a noop). This is some pretty gnarly target-dependent stuff which seems like it would best be hidden in the backend (e.g. architectures that have "constant island"-like passes might want to stash the data in there instead).</div>
<div><br></div><div>-- Sean Silva</div></div></div></div>