<div dir="ltr"><div class="gmail_extra">by the way, everything mentioned in the last mail is of course X86 specific, because that is what I am currently targeting. </div><div class="gmail_extra"><br></div><div class="gmail_extra">Cheers</div><div class="gmail_extra"><br><div class="gmail_quote">2015-03-08 21:49 GMT+01:00 Peter Edelstein <span dir="ltr"><<a href="mailto:peter.c.edelstein@gmail.com" target="_blank">peter.c.edelstein@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hello,<div><br></div><div>thank you very much for answering. I am trying to do the following: get the encoding for each instruction and if that encoding contains a C3 byte, insert a NOP instruction (or multiple NOP instructions, or any other instructions) before that instruction. The idea behind this is to protect against ROP (Return Oriented Programming) attacks. By inserting a NOP the attacker can no longer abuse alignment to get a useful gadget. I thought a machine function pass would be sufficient to accomplish this. However, now I realize that this was probably a rather naive thought. </div><div><br></div><div>Can you think of any other approaches for achieving this?</div><div><br></div><div>Cheers.</div><div><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">2015-03-08 21:21 GMT+01:00 Tim Northover <span dir="ltr"><<a href="mailto:t.p.northover@gmail.com" target="_blank">t.p.northover@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi,<br>
<span><br>
> As the comment suggests I want to inspect the target-specific opcode of each<br>
> instruction. By opcode I mean the actual machine code (=encoding of that in<br>
> struction as an array of bytes), not the integer descriptor returned by<br>
> I->getOpcode().<br>
<br>
</span>That's not generally possible. The best you might be able to do would<br>
be to lower each MachineInstr to an MCInst and emit its encoding via<br>
an MCCodeEmitter. But that has quite a few problems:<br>
<br>
  + There's virtually no hope before register allocation. You'd<br>
probably get an assertion if you're lucky.<br>
  + Many targets don't have really separate "opcode" and "operand"<br>
bytes. Just 32-bit (say) instructions that have<br>
  + A MachineInstr can become 0, 1, or many real target .instructions<br>
  + What you get back may or may not be what's emitted finally anyway.<br>
  + It's slow and redundant work.<br>
<br>
What are you trying to do with the opcode? There may be a better way.<br>
<br>
Cheers.<br>
<span><font color="#888888"><br>
Tim.<br>
</font></span></blockquote></div><br></div></div></div></div>
</blockquote></div><br></div></div>