<div class="gmail_quote">On Tue, Jun 19, 2012 at 2:49 PM, Richard Trieu <span dir="ltr"><<a href="mailto:rtrieu@google.com" target="_blank">rtrieu@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="font-family:arial,helvetica,sans-serif"><font><div><div class="h5"><div class="gmail_quote">On Fri, Jun 8, 2012 at 6:41 PM, John McCall <span dir="ltr"><<a href="mailto:rjmccall@apple.com" target="_blank">rjmccall@apple.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word"><div><div><div><div>On Jun 8, 2012, at 5:47 PM, Richard Trieu wrote:</div><blockquote type="cite"><div class="gmail_quote">On Fri, Jun 8, 2012 at 4:29 PM, John McCall <span dir="ltr"><<a href="mailto:rjmccall@apple.com" target="_blank">rjmccall@apple.com</a>></span> wrote:<br>


<blockquote class="gmail_quote" style="margin-top:0px;margin-right:0px;margin-bottom:0px;margin-left:0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div>On Jun 8, 2012, at 4:24 PM, Richard Trieu wrote:<br>
> Add a bit to VarDecl that is set to true when its address is taken or it gets passed by non-const reference.<br>
<br>
</div>Just out of curiosity, is this bit set for variables of class type that are used as an operand of a trivial copy constructor or copy assignment operator?<br>
<span><font color="#888888"><br>
John.<br>
</font></span></blockquote></div><br><div>No, the bit is not currently set for those uses.</div>
</blockquote></div><br></div></div><div>Then please document the desired semantics more accurately, like "the address is taken or bound to a reference other than either operand of a trivial copy operation" or whatever semantics we actually settle on.</div>


<div><br></div><div>Please document that this is only accurate when all possible accesses have been seen.  For example, it is only accurate for local variables after their scope ends, and it is only accurate for global variables at the end of the translation unit and only if they have internal linkage.  It is also basically meaningless within templates.</div>


<div><br></div><div><div>Please document that this is only meant to be a conservative approximation of whether the address is used;  it may be true in situations when the address is actually statically provable to not escape.  Alas, your patch does not implement a conservative approximation.  Among other things, you're only setting this bit in direct uses, but you really do need to be looking through anything that propagates reference-ness, including member accesses, base/derived casts, l-value reinterpreting casts, comma operators, and conditional operators;  I do not claim that this list is exhaustive.  Other things which take references to objects are lambda by-reference captures and member calls on the object;  this, too, I do not claim to be exhaustive.</div>


<div><br></div></div><div>That leads into the very interesting question of how we should validate the correctness of this bit.  We really can't rely on it until we have some sort of validation story.</div><div><br></div>


<div>Arguably, this bit should never be set on a variable of reference type.</div><div><br></div><div><div>+    /// \brief Whether this variable has its address taken or is referenced.</div><div>+    unsigned HasReference : 1;</div>


</div><div><br></div><div><div>+  /// Whether this variable has its address taken or is referenced.</div><div>+  bool hasReference() const { return VarDeclBits.HasReference; }</div><div>+  void setReference(bool ref) { VarDeclBits.HasReference = ref; }</div>


</div><div><br></div><div>This is a poor choice of names;  it is confusable with both the concept of a variable of reference type and the concept of whether a declaration has been referenced in the translation unit.  I would go with isAddressTaken / setAddressTaken, with the C++ behavior with references being understood (and documented).</div>


<div><br></div><div>Also, the semantics you're actually tracking are quite a bit more subtle than whether the address it taken, because you're specifically ignoring initializations of const references.  That's quite suspect and quite a bit less generically useful.  Also note that it is not illegal to bind a const reference to something and then modify it through that reference, either due to a mutable field or due to the constness being cast away.</div>


<div><br></div><div>setAddressTaken can default its argument to true.</div><div><br></div><div>You are not initializing this field to false.</div><div><br></div><div><div>You are not serializing and deserialization this field.  The ParmVarDecl abbreviation should assume this bit is 'false', I guess.</div>


</div><div><br></div><div><div>--- lib/Sema/SemaInit.cpp<span style="white-space:pre-wrap"> </span>(revision 158223)</div><div>+++ lib/Sema/SemaInit.cpp<span style="white-space:pre-wrap">       </span>(working copy)</div><div>

@@ -6211,6 +6211,12 @@</div>
<div>   Expr *InitE = Init.get();</div><div>   assert(InitE && "No initialization expression?");</div><div> </div><div>+  QualType QT = Entity.getType();</div><div>+  if (QT->isReferenceType() && !QT.getNonReferenceType().isConstQualified())</div>


<div>+    if (DeclRefExpr *DRE = dyn_cast<DeclRefExpr>(InitE->IgnoreParens()))</div><div>+      if (VarDecl *VD = dyn_cast<VarDecl>(DRE->getDecl()))</div><div>+        VD->setReference(true);</div></div>


<div><br></div><div>This is not an appropriate place for this check;  not everything goes through PerformCopyInitialization.  This needs to happen in InitializationSequence::Perform for a reference-binding step.</div><div>


<br></div><div><div>+  if (DeclRefExpr *DRE = dyn_cast<DeclRefExpr>(op))</div><div>+    if (VarDecl *VD = dyn_cast<VarDecl>(DRE->getDecl()))</div><div>+      VD->setReference(true);</div></div><div><br>

</div>
<div>You're not even looking through dyn_casts here.  You should extract out a function which walks an expression and marks variables that are bound in this way.  Alternatively, you may be able to piggy-back on the C++11 ODR-use code.</div>


<span><font color="#888888"><div><br></div><div>John.</div></font></span></div></blockquote></div><br></div></div><div>Another shot at adding an AddressTaken bit.  A warning was created to show which part of the code construct was responsible for setting the AddressTaken bit.  At the point where a reference (const or not) is bound, or an address is taken, a recursive function is called that will traverse the expression and set this bit for matching VarDecls.  Also, the ASTReaderDecl and ASTWriterDecl have been updated for this bit.</div>

<div><br></div><div>Currently, the analysis doesn't go into class method calls and is one of the unhandled ways for the address to leak.  Classes weren't important to my original use of this bit, but I'm open to suggestions on how to handle them.</div>


</font></div>
</blockquote></div><br><div>Ping?</div>