<div dir="ltr">Hi Douglas and John,<div><br></div><div style>I started to try your approach, but I'm still not sure what it does, and still a little doubtful that it's easy to catch allocation by non-global (in-class) operator news.  When a project has 100 in-class operator news, doesn't it need to prepare 101 replacement functions?  If it needs, I think it's so unrealistic.  We cannot track all changes in a big project (e.g. WebKit).  If a developer adds a new class with its local operator new, it's impossible to track all such local operator news.</div>

<div style><br></div><div style>Could you tell me make sure 1) what should happen in the compiler and 2) what replacement functions should be added, in the simple example below?</div><div style><br></div><div style>(Also, I'd like to know where is the DWARF code in Clang you mentioned.)</div>

<div style><br></div><div style><br></div><div style><div>class Global {</div><div> public:</div><div>  Global(int x): _x(x) {}</div><div> private:</div><div>  int _x;</div><div>};</div><div><br></div><div>class Local {</div>

<div> public:</div><div>  Local(int x): _x(x) {}</div><div>  void* operator new(size_t size) { return malloc(size); }</div><div>  void operator delete(void* p) { return free(p); }</div><div> private:</div><div>  int _x;</div>

<div>};</div><div><br></div><div>int main() {</div><div>  Global *g = new Global(10);</div><div>  delete g;</div><div>  Local *l = new Local(20);</div><div>  delete l;</div><div>  return 0;</div><div>}</div><div><br></div>

</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">2013/2/11 Dai MIKURUBE <span dir="ltr"><<a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a>></span><br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

<div dir="ltr">Hi Doug,<br><div class="gmail_extra"><br><br><div class="gmail_quote"><div class="im">2013/2/7 Dai MIKURUBE <span dir="ltr"><<a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a>></span><br>

<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div dir="ltr">Thank you, Douglas.<div><br></div><div>Ok, I'll give it a try.  I think it'll take a few weeks.  I may ask more questions later since I might not understand this design well.</div></div><div class="gmail_extra">


<div><div>
<br><br><div class="gmail_quote">2013/2/6 Douglas Gregor <span dir="ltr"><<a href="mailto:dgregor@apple.com" target="_blank">dgregor@apple.com</a>></span><br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">



<div style="word-wrap:break-word"><br><div><div><div>On Feb 4, 2013, at 9:18 AM, Dai MIKURUBE <<a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a>> wrote:</div><br><blockquote type="cite">
<div dir="ltr">Thank you, Douglas and John,<div><br></div><div>The idea "somehow" sounds good and reasonable to me, so I'm basically positive to try and implement it.  But sorry, I'm still not sure of what it actually does...<br>





</div><div><br></div><div>In this idea, the operator new is replaced.  So,</div><div>1) Who finally calls the original operator new? (User's replacement operator new does?)</div></div></blockquote><div><br></div></div>



Yes.</div><div><div><br><blockquote type="cite"><div dir="ltr"><div>2) Who "associates" the type of a particular "new" expression with the address?</div></div></blockquote><div><br></div></div>
The replacement new would sniff out its return address.</div><div><div><br><blockquote type="cite"><div dir="ltr">

<div>3) Who "records" the association, and where is it recorded?</div></div></blockquote><div><br></div></div><div>The compiler records it, probably in the DWARF. DWARF exceptions work this way, with a side table mapping instruction address ranges to EH information.</div>



<div><br></div></div></div></blockquote></div></div></div></div></blockquote></div><div>Would you tell me any good starting points to read in DWARF code if you know?  I'd like to try it with using examples in Clang.</div>


<div><br></div><div>Thank you for your help.</div><div><div class="h5"><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">


<div class="gmail_extra"><div><div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">


<div style="word-wrap:break-word"><div><div></div><div><span style="white-space:pre-wrap">      </span>- Doug</div><div><div><br><blockquote type="cite"><div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">2013/2/1 John McCall <span dir="ltr"><<a href="mailto:rjmccall@apple.com" target="_blank">rjmccall@apple.com</a>></span><br>





<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div>On Jan 31, 2013, at 10:53 AM, Douglas Gregor <<a href="mailto:dgregor@apple.com" target="_blank">dgregor@apple.com</a>> wrote:<br>






> On Jan 31, 2013, at 9:22 AM, Dai MIKURUBE <<a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a>> wrote:<br>
>> Thank you for the comments, John and Richard.<br>
>><br>
>> At first, I don't stick to this design and implementation (I'm saying not to make misunderstanding).  I'd just like to solve the following problem.<br>
>><br>
>> 1) Capture allocated types of as most objects as possible.<br>
>> 2) No need to change almost all the existing code.  Just adding some code.<br>
>> 3) Capture objects allocated by both global and in-class operator new.  (Many projects naturally have many in-class operator new.)<br>
>> 4) Capture objects allocated by placement new.  (Placement new is used for malloc() memory allocation in some projects.)<br>
>> 5) Actually, capturing object deallocation is less required for our purpose.  (But, it's more required in general.)<br>
>><br>
>> If we can solve this problem in another better way, I'm so positive to switch to the way.  Do you have any ideas?  It's useless without (3) and (4) as I discussed in the previous comment and the document.<br>






>><br>
><br>
> John has sketched out of potential scheme:<br>
><br>
>       Perhaps it would be better to replace operator new, record return addresses, and then somehow map those back to source code?<br>
><br>
> Basically, the idea here is to associate the type of a particular "new" expression with the address at which the call to operator new occurs (DWARF does this sort of thing), so when we're emitting IR for<br>






><br>
>       new A<br>
><br>
> the type of A is associated with the address of the associated call instruction.<br>
><br>
> Then, you replace operator new with whatever function interposition approach is right for your platform (LD_PRELOAD, DYLD_INSERT_LIBRARIES, whatever). The replacement operator new sniffs out its return address, then matches that up with the corresponding call site to get type information. If it can't find the type information (because the call site wasn't compiled with it), at least you're still catching the allocation.<br>






><br>
> There are several advantages to John's suggestion over your current approach. For one, it requires no changes to semantic analysis or the AST, so turning this feature on isn't going to change the meaning of your source code, and the implementation can be limited to Clang's lowering + some work on the LLVM side. Second, the type information can be recorded off to the side (e.g., like DWARF exception tables), so they don't have an impact on how the code executes. Because of this and the fact that one can interpose operator new/operator delete at run time, it means that one could emit this information as part of the build and then decide at run time whether to interpose or not, so it becomes just another debugging/profiling aid that one could generate with the rest of the debug info.<br>






<br>
</div>Right, and it's relatively straightforward to sniff out non-global operator news (by mangled symbol name) and interpose them all.<br>
<br>
This approach would *not* work when operator new is potentially optimized out, e.g. when it's inlined, as is the case with the global placement new.<br>
<br></blockquote><div>Yes, this case worries me a little.  (But in my understanding, some compile options would work to turn off inlining operator new, wouldn't it?)  I guess that speed-down by turning-off inlining should be acceptable since my approach has already have a similar speed-down.</div>





<div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Another option would be to add an LLVM instrumentation pass that runs on unoptimized code.  This is the sort of thing that should be achievable with a plugin, although I don't know if that's currently true.<br>
<span><font color="#888888"><br></font></span></blockquote><div>Can we instrument by plug-in at the LLVM-level?  If so, that's also sounds like a reasonable way.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">





<span><font color="#888888">
John.<br>
</font></span></blockquote></div><br><br clear="all"><div><br></div>-- <br>Dai MIKURUBE<br>   <a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a><br>
</div></div>
</blockquote></div></div></div><br></div>
</blockquote></div><br><br clear="all"><div><br></div></div></div><span><font color="#888888">-- <br>Dai MIKURUBE<br>   <a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a><br>
</font></span></div>
</blockquote></div></div></div><span class="HOEnZb"><font color="#888888"><br><br clear="all"><div><br></div>-- <br>Dai MIKURUBE<br>   <a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a><br>
</font></span></div></div>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>Dai MIKURUBE<br>   <a href="mailto:dmikurube@acm.org" target="_blank">dmikurube@acm.org</a><br>
</div>